[AI리포터]
[디지털투데이 AI리포터] 어도비가 인공지능(AI) 모델 학습 과정에서 불법 복제 도서를 사용했다는 의혹으로 집단소송에 직면했다.
18일(현지시간) IT매체 테크크런치에 따르면, 오리건주 출신 작가 엘리자베스 라이온은 자신과 다른 저자들의 작품이 어도비의 슬림LM(SlimLM) 프로그램 학습에 포함됐다며 집단소송을 제기했다.
슬림LM은 모바일 기기에서 문서 보조 작업을 최적화하도록 설계된 소형 언어 모델 시리즈다. 어도비는 해당 모델이 셀레브라스(Cerebras)가 공개한 오픈소스 데이터셋 'SlimPajama-627B'를 사전 학습에 활용했다고 밝힌 바 있다. 그러나 소장에 따르면 이 데이터셋에는 불법 복제 도서 모음으로 알려진 북3(Book3)가 포함돼 있으며, 이 과정에서 원고와 집단 구성원들의 저작물이 동의나 보상 없이 사용됐다는 주장이다.
[디지털투데이 AI리포터] 어도비가 인공지능(AI) 모델 학습 과정에서 불법 복제 도서를 사용했다는 의혹으로 집단소송에 직면했다.
18일(현지시간) IT매체 테크크런치에 따르면, 오리건주 출신 작가 엘리자베스 라이온은 자신과 다른 저자들의 작품이 어도비의 슬림LM(SlimLM) 프로그램 학습에 포함됐다며 집단소송을 제기했다.
슬림LM은 모바일 기기에서 문서 보조 작업을 최적화하도록 설계된 소형 언어 모델 시리즈다. 어도비는 해당 모델이 셀레브라스(Cerebras)가 공개한 오픈소스 데이터셋 'SlimPajama-627B'를 사전 학습에 활용했다고 밝힌 바 있다. 그러나 소장에 따르면 이 데이터셋에는 불법 복제 도서 모음으로 알려진 북3(Book3)가 포함돼 있으며, 이 과정에서 원고와 집단 구성원들의 저작물이 동의나 보상 없이 사용됐다는 주장이다.
북3는 약 19만1000권의 도서를 포함한 대규모 데이터셋으로, 생성형 AI 훈련에 활용되며 지속적인 법적 논란을 불러왔다. 앞서 애플과 세일즈포스 역시 유사한 혐의로 소송에 휘말린 바 있다.
이번 어도비 소송은 AI 훈련 데이터의 출처와 법적 책임을 둘러싼 쟁점을 다시 한번 부각시키며, 향후 업계 전반에 적지 않은 영향을 미칠 것으로 전망된다.
<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>




























































