상단영역

본문영역

데이터 생명주기 관점의 신뢰성과 형평성

데이터 형평성과 생성형 AI는 새로운 분야의 과제
데이터 신뢰도 측정은 윤리적 관점은 기본권 개념과 연결
데이터 생명주기 관점 데이터 형평성

  • Editor. 김맹근 기자
  • 입력 2024.09.11 08:43
  • 수정 2024.09.11 08:50
  • 댓글 0
이 기사를 공유합니다
사진 : pixabay
사진 : pixabay

[디지털비즈온 김맹근 기자] 챗GPT(ChatGPT), 바드(Bard) 등 다양한 생성형 AI가 등장하면서 전 세계적으로 데이터 형평성 문제에 대한 논의가 활발해졌으며, 그 중심에는 데이터가 개인과 기업, 생태계를 위한 기술 시스템의 형평성에 미치는 영향에 초점을 맞춘 ‘데이터 형평성’이라는 개념이다.

‘데이터 형평성’ 개념은 새로운 개념이 아니라 인권에 기반을 두고 있으며, 데이터 프라이버시, 보호, 윤리, 데이터 주권 및 책임에 대한 지속적인 노력의 결과로 등장한다. 그러나, ‘데이터 형평성과 생성형 AI’는 새로운 분야로 고유한 과제를 안고 있다.

GPAI 데이터 거버넌스 워킹그룹(Data Governance Working Group)은 데이터 거버넌스 및 데이터 권리 측면에서 문제를 최소화하는 방법으로 TDIF를 제시한다. 데이터 생명주기에서 개인과 공동체가 데이터 권리를 주장할 수 있는 권한을 부여하는 동시에 안전하고 공정하며 공평한 데이터 공유를 발전시킬 수 있는 이상적인 신뢰 상태를 달성하기 위해 데이터 기관은 다음 요소를 고려해야 한다.

통합 데이터 거버넌스 접근 방식은 데이터 거버넌스에 초점을 맞추고, 다중 이해관계자의 접근 방식을 고려하는 데이터 거버넌스 프레임워크 2.0을 기반으로 한다. 데이터 거버넌스의 다중 이해관계자 접근법은 정책 입안자, 데이터 보유자, 개인이나 공동체를 고려하는 방법으로, 어느 수준(국가, 초국가적 또는 국제적)에서 어떤 과제를 수행해야 하는지 정의한다.

데이터 신뢰도 측정

신뢰성에 대한 다양한 관점이 존재하지만, 특징에 따라 세 가지 주요 관점으로 분류할 수 있다. 기술적 관점은 시스템 중심적이며, 데이터 또는 AI 기반 구성 요소의 내재적 속성을 검증할 수 있는 능력을 의미한다다. 이 관점에서는 신뢰성, 의존성, 정확성, 재현성, 유지보수성과 같은 속성이 포함된다.

윤리적 관점은 기본권 개념과 연결된다. 이는 AI 시스템이 관련 법률과 규정을 완전히 준수하고 윤리적 원칙을 준수하며 작동하는 것이 중요함을 강조한다. 이 관점에서는 공정성, 개인정보 보호, 책임과 같은 속성을 다룬다. 상호작용 관점은 투명성, 설명 가능성, 사용성과 같은 개념과 연결되어 있다.

데이터 생명주기 관점 데이터 형평성

데이터 형평성의 복잡성 문제를 효과적으로 해결하기 위해서는 다양한 이해관계자가 데이터의 다양한 관점을 이해할 필요가 있다. 데이터 형평성은 서로 밀접하게 연관된 네 가지 유형으로 분류된다. 입력 데이터 형평성은 기반 모델(Foundation model2)) 구축에 수집되고 사용되는 데이터에 중점을 두는 동시에 이 데이터가 수반할 수 있는 잠재적인 단점도 해결한다.

알고리즘 데이터 형평성(대표성, 특징적 및 접근 형평성)에는 입력 데이터를 해석하여 출력 결과를 생성하도록 알고리즘을 공식화하고 설계하는 중개 단계가 도입된다.

출력 데이터 형평성은 기반 모델 산출물에서 비롯되는 가시적 효과가 공정하게 분배되는 것을 중점으로 한다. AI 시스템에 대한 공동 소유권을 주장하고 모델에서 파생된 이익을 공평하게 분배하는 것이 포함된다.

AI 시스템의 설계자와 구현자는 특정 집단에 대한 불균형적인 영향을 모니터링하고 완화하기 위해 리소스를 할당하고, 시스템 결과물에 편견과 차별을 반영하여 이를 시정할 수 있는 메커니즘을 마련하는 등의 조처를 하는 것이 중요하다.

결과적으로 인공지능 국제협의체(GPAI)가 제시한 ‘신뢰성 있는 데이터의 제도적 프레임워크(TDIF)’는 조직 내부 및 조직 간 안전하고 포용적이며 공평한 데이터 수집, 공유 및 사용을 가능하게 하는 도구이다. 아울러 세계경제포럼(WEF)의 글로벌 미래위원회는 데이터 생명주기의 모든 단계(입력, 알고리즘, 출력)에 걸쳐 데이터 형평성을 보장하는 것이 중요하다고 강조한다.

관련기사

저작권자 © 디지털비즈온 무단전재 및 재배포 금지

개의 댓글

0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400

내 댓글 모음

하단영역