학습 데이터 저작권 관련 내용 미비
오픈소스 확대로 분쟁 증가 가능성
"데이터 보상 원칙과 기준 확립해야"
샘 올트먼 오픈AI 최고경영자(CEO)가 잇따라 자신의 엑스(X)에 지브리 화풍의 이미지를 공유했다. 샘 올트먼 엑스(X) 캡처 |
'스튜디오 지브리' 화풍이 온라인에 유행하면서 인공지능(AI) 학습 데이터 저작권 논란이 커졌지만, 정부는 AI 기본법 시행령 초안 마련을 저작권 논의 없이 진행하고 있다. AI의 저작권 침해 문제가 국내외에서 계속 제기되고 있는 만큼, 실효성 있는 법제화를 위해선 논의의 물꼬를 터야 한다는 목소리가 높다.
곳곳에서 이미 AI 학습 저작권 분쟁 중
7일 과학기술정보통신부에 따르면 정부는 이달 중 이해관계자들의 의견을 수렴하고 AI 기본법의 시행령 초안을 마련할 예정이다. 그런데 지난해 12월 국회 본회의를 통과한 이 기본법엔 학습 데이터의 저작권 보호를 명시한 조항이 없기 때문에 시행령에도 포함되지 않을 것으로 보인다. 당초 입법 과정에서 저작권 부분 법제화는 문화체육관광부가 별도로 맡기로 했지만, 뚜렷한 진전이 없다. 문체부 관계자는 이날 한국일보와 통화에서 "관계자들 간 이해 충돌을 조정하는 방안을 모색 중"이라는 원론적 답변을 내놓았다.
하지만 AI 기술의 발전 속도와 사회 영향을 감안하면 저작권 이슈를 제외한 법제화는 자칫 선언적 수준에 그칠지 모른다는 우려가 나온다. 유럽연합(EU)에 이은 세계 두 번째 법제화라는 '속도'도 중요하지만 시장에 방향을 제시할 수 있는 실질적 규제를 확립할 필요도 있다는 얘기다. 이성엽 고려대 기술경영대학원 교수는 "AI 기술 전체를 아우르는 법인 만큼 학습 데이터 저작권에 대해 원칙적인 내용이라도 포함될 필요가 있다"며 아쉬워했다.
AI의 학습 데이터를 둘러싼 저작권 분쟁은 이미 국내외에서 다수 발생했다. 뉴스 콘텐츠를 AI 학습에 무단 활용했다며 KBS·MBC·SBS는 올 초 네이버 등을 상대로 저작권 침해중지 소송을 제기했다. 2023년 1월 사라 앤더슨을 비롯한 시각 예술가들은 저작권 이미지를 무단 사용한 혐의로 미드저니 등 생성형 AI 기업을 상대로 소송을 걸었다. 마이클 샤본 등 미국 작가들도 같은 해 오픈AI가 작품들을 무단 복사해 학습 데이터로 이용했다며 집단소송을 냈다.
"콘텐츠 특성 따라 비용과 공개 범위 달라야"
게티이미지뱅크 |
누구나 사용·수정할 수 있는 오픈소스 AI가 확대될수록 저작권 문제는 더 복잡해질 것으로 전망된다. 최경진 가천대 법학과 교수는 "오픈소스로 만든 결과물이 저작권 침해 문제에 맞닥뜨릴 경우 '누가 책임져야 하나'를 둘러싸고 법적 다툼이 생길 수 있다"고 지적했다. 오픈소스를 공개할 때 2차 저작물 권리 범위를 명시한다 해도 다양한 오픈소스를 사용해 만든 결과물의 경우 개발자, 수정자, 이용자 등 여러 사람 간에 서로 다른 권리가 충돌할 가능성이 있다.
전문가들은 AI 산업 혁신을 저해하지 않는 선에서 창작자의 권리가 존중될 수 있도록 구체적인 제도 논의를 시작해야 할 때라고 입을 모았다. 이성엽 교수는 "학습 데이터 사용의 보상 원칙과 기준부터 명시할 필요가 있다"고 말했다. 박애란 한국저작권위원회 변호사는 "콘텐츠 특성에 따라 비용 징수나 학습 내용 공개 범위를 설정해야 한다"며 "저작물이 얼마나 사용됐는지와 같은 양적 측면과 사용 목적 등 질적 요소를 함께 고려하는 법제화가 필요하다"고 밝혔다.
김태연 기자 tykim@hankookilbo.com
세종= 신혜정 기자 arete@hankookilbo.com