컨텐츠로 건너뛰기
뉴스
서울
맑음 / -3.9 °
AI타임스 언론사 이미지

오픈AI, 실제 업무 자료 제출 요구 논란...AI 평가용 데이터 수집에 법적 우려

AI타임스
원문보기
[박찬 기자]
(사진=셔터스톡)

(사진=셔터스톡)


오픈AI가 차세대 AI 모델의 성능을 평가하기 위해 외부 계약자들에게 현재와 과거 직장에서 수행한 실제 업무 과제와 산출물을 제출해 달라고 요청하는 것으로 드러났다. 이 과정에서 영업 비밀 노출의 위험성이 제기됐다.

와이어드는 9일(현지시간) 입수한 오픈AI와 데이터 학습 기업 핸드셰이크 AI의 내부 문서를 인용, 오픈AI가 다양한 직군의 계약자들을 고용해 현실 세계의 실제 업무 과제를 수집하고 있다고 전했다.

오픈AI는 지난해 9월부터 여러 산업에서 인간 전문가와 AI 모델의 성과를 비교하는 새로운 평가 체계를 도입했으며, 이를 인공일반지능(AGI) 달성의 핵심 지표로 삼고 있다.

한 내부 문서에는 "여러 직업군의 인력을 고용해 실제 정규직 업무에서 수행한 과제를 기반으로 데이터를 수집하고 있으며, 이를 통해 AI 모델이 해당 과제를 얼마나 잘 수행하는지 측정한다"라고 명시돼 있다. 계약자들은 수시간이나 수일이 걸렸던 장기적이고 복잡한 업무를 하나의 과제로 정리해 제출해야 한다.

오픈AI의 설명 자료에 따르면, 계약자들은 자신이 실제로 수행했던 업무를 설명하고 워드 문서, PDF, 파워포인트, 엑셀 파일, 이미지, 코드 저장소 등 실제 산출물을 업로드해야 한다. 요약본이 아닌 '실제 결과물' 제출이 원칙이며, 필요하면 실제 상황을 가정해 만든 자료도 허용된다.

'실제 업무 과제'는 두가지 요소로 구성된다. 하나는 상사나 동료로부터 받은 업무 지시 내용이며, 다른 하나는 이에 대한 실제 작업 결과물이다. 오픈AI는 여러 차례에 걸쳐 "반드시 실제 직무에서 본인이 수행한 업무여야 한다"라고 강조한 것으로 알려졌다.


문서에 제시된 예 중 하나는 초고액 자산가를 대상으로 하는 고급 컨시어지 업체의 '시니어 라이프스타일 매니저'가 수행한 업무다. 이 과제는 바하마를 처음 여행하는 가족을 위해 7일간의 요트 여행 일정을 담은 2페이지 분량의 PDF 초안을 작성하는 것이며, 계약자는 실제 고객을 위해 제작했던 바하마 여행 일정표를 '전문가의 결과물'로 제출하게 돼 있다.

오픈AI는 계약자들에게 기업 기밀과 개인 정보를 반드시 삭제하거나 익명화하라고 지시했다. 내부 자료의 '중요 안내' 항목에는 개인 정보, 영업 비밀, 비공개 내부 전략, 미출시 제품 정보 등을 제거하라는 내용이 포함돼 있다. 일부 문서에는 기밀 정보 삭제를 돕는 챗GPT 도구인 '슈퍼스타 스크러빙(Superstar Scrubbing)'이 언급되기도 했다.

하지만 법적 위험성은 적지 않다는 지적이다. 지식재산권 전문 변호사 에번 브라운은 "이 정도 규모로 계약자를 통해 기밀 정보를 수집하는 AI 연구소는 영업비밀 침해 소송에 노출될 수 있다"라고 지적했다.


그는 "이전 직장의 문서를, 설령 일부 삭제했다고 하더라도 AI 기업에 제공하는 행위는 비밀유지계약(NDA) 위반이나 영업비밀 유출로 이어질 가능성이 있다"라며 "AI 연구소가 계약자의 판단에 지나치게 의존하고 있는 것은 상당한 위험"이라고 말했다.

이번 문건은 오픈AI를 비롯한 주요 AI 기업들이 실제 기업 업무를 자동화할 수 있는 AI 에이전트를 만들기 위해 어떤 전략을 쓰고 있는지를 보여준다. 오픈AI, 앤트로픽, 구글 등은 이미 고품질 학습 데이터를 확보하기 위해 대규모 계약자 네트워크를 운영 중이다. 기존에는 서지(Surge), 메르코어(Mercor), 스케일 AI와 같은 외주 업체가 주로 데이터 수집을 담당해 왔지만, 최근에는 더 높은 수준의 전문성을 요구하면서 비용도 크게 상승했다.

이로 인해 AI 학습 데이터 시장 자체가 하나의 거대 산업으로 성장하고 있다. 핸드셰이크 AI는 2022년 기준 기업 가치 35억달러로 평가됐고, 서지는 지난해 투자 유치 과정에서 최대 250억달러의 가치를 제시한 것으로 전해졌다.


한편, 오픈AI는 실제 기업 데이터를 다른 방식으로 확보하는 방안도 검토했던 것으로 알려졌다. 파산·청산 기업의 자산을 매각하는 일을 하는 한 관계자는 오픈AI가 개인정보를 제거한 문서·이메일 등 기업 내부 데이터를 확보할 수 있는지 문의해 왔다고 밝혔다.

그러나 관계자는 "개인 정보를 완벽하게 삭제할 수 있다는 확신이 없어 논의를 진행하지 않았다"라고 전했다.

박찬 기자 cpark@aitimes.com

<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>

info icon이 기사의 카테고리는 언론사의 분류를 따릅니다.

AI 이슈 트렌드

실시간
  1. 1용인 반도체 클러스터 승인
    용인 반도체 클러스터 승인
  2. 2시내버스 공공관리제
    시내버스 공공관리제
  3. 3나영석 등산 예능
    나영석 등산 예능
  4. 4한병도 정책조정회의
    한병도 정책조정회의
  5. 5트럼프 그린란드 매입
    트럼프 그린란드 매입

AI타임스 하이라이트

파워링크

광고
링크등록

당신만의 뉴스 Pick

쇼핑 핫아이템

AD