| 동아일보 IT사이언스팀 기자들이 IT, 과학, 우주, 바이오 분야 주목할만한 기술과 트렌드, 기업을 소개합니다. “이 회사 뭐길래?” 기술로 세상을 바꾸는 테크 기업들의 비하인드 스토리! 세상을 놀라게 한 아이디어부터 창업자의 요즘 고민까지, 궁금했던 그들의 모든 것을 파헤칩니다. |
배경훈 부총리 겸 과학기술정보통신부 장관과 하정우 청와대 AI미래기획수석 등 참석자들이 30일 오후 서울 강남구 코엑스 오디토리움에서 열린 ‘독자 AI파운데이션 프로젝트’ 발표회에서 기념촬영을 하고 있다. 2025.12.30/뉴스1 |
‘국가대표 AI’를 개발하겠다는 정부의 ‘독자 AI 파운데이션(독파모)’ 사업이 흙탕물 싸움으로 번지고 있다. 네이버가 중국 알리바바의 인공지능(AI) 모델 ‘큐웬(Qwen)’의 이미지와 음성 인코더를 차용했다고 인정한 가운데 다른 참여 기업에서 평가 기관측에 이에 대한 문제제기를 한 것으로 확인됐다.
7일 정보기술(IT) 업계에 따르면 독파모 사업에 참여한 기업이 평가 기관으로 참여 중인 한국정보통신기술협회(TTA)에 기술 검토 보고서를 제출했다. 네이버가 공개한 ‘하이퍼클로바X-띵크-32B·옴니-8B’ 모델에 활용된 이미지·음성 인코더가 알리바바 ‘큐웬 2.5 ViT’ ‘큐웬2-오디오’의 것을 차용한 데 따른 것이다.
동아일보가 입수한 이 보고서에는 “(최신 연구들에 따르면) 인코더는 단순 부품이 아닌 핵심 지능 모듈”이라며 “비전(시각) 인코더의 품질은 멀티모달 대형언어모델(MLLM) 최종 성능의 상한선을 결정한다”고 지적했다.
국가대표AI 선발전에 무슨 일이?
정부의 독파모 사업에는 네이버클라우드, LG AI연구원, SK텔레콤, 업스테이지, NC AI 등 5개 컨소시엄이 예산을 통과하고 참여하고 있다. 이달 2일 오픈소스 공개 플랫폼인 ‘깃허브’에 업스테이지의 ‘솔라-오픈-100B’가 중국 AI 기업 모델과 구조적으로 유사하다는 의혹이 제기됐지만, 업스테이지가 공개 검증 자리를 마련하며 일단락이 됐다.
하지만 이어 깃허브에 ‘국가 AI 파운데이션 모델 프롬 스크래치 검증 프로젝트’라는 보고서가 올라오며 이번에는 네이버의 AI 모델이 문제가 됐다. 네이버가 학습 과정에서 활용한 큐웬의 시각 및 음성 인코더를 차용했다는 것이다.
이 의혹에 대해 네이버측은 “네이버는 독자적인 비전 기술력을 충분히 보유하고 있으나, 이번 모델에서는 글로벌 기술 생태계와의 호환성 및 전체 시스템의 효율적 최적화를 고려해 검증된 외부 인코더를 전략적으로 채택했다”며 “파운데이션 모델은 입력된 정보를 해석하고 추론하며 결과를 만들어내는 ‘두뇌’에 해당한다. 이 핵심 엔진을 100% 자체 기술로 개발해왔다”는 입장을 밝혔다. 즉 효율성을 위해 중국의 인코더를 활용했지만 핵심 엔진은 자체 기술로 개발했기 때문에 문제가 없다는 주장이다.
[서울=뉴시스] 과학기술정보통신부는 ‘독자 적인 인공지능(AI) 프로젝트’ 5개 정예팀으로 네이버클라우드, 업스테이지, SK텔레콤, NC AI, LG경영개발원 AI연구원을 선정했다고 4일 밝혔다. 정부는 데이터·GPU·인재 등 핵심 자원을 집중 지원할 계획이다. 개발된 모델은 올해말까지 1차 단계평가를 거쳐 5개 팀 중 4개 팀으로 압축된다. (그래픽=안지혜 기자) hokma@newsis.com |
비전 인코더는 무슨 역할?
인코더는 입력되는 이미지나 음성 데이터를 AI가 활용하는 숫자 데이터로 변환해주는 역할을 한다. 비전 인코더의 경우 AI의 ‘눈’, 음성 인코더는 ‘귀’에 해당하는 셈이다. 다른 정예팀에서 제기하는 ‘최종 성능의 상한선을 결정한다’는 지적은 어떤 인코더를 쓰느냐에 따라 눈의 ‘시력’이 달라질 수 있기 때문이다.
시력이 0.2인 사람과 2.0인 사람이 보는 것이 다른 것처럼 인코더의 성능이 결과 값에도 영향을 미친다는 것이다. 국내의 AI 전문가는 “아무리 두뇌가 뛰어나도 보이는 것에 대해서만 처리할 수 있지 않냐”며 “관점에 따라 인코더의 중요성을 다르게 판단할 수 있지만 최근 연구에서는 그 중요성이 점점 커지고 있다”고 했다.
본보가 입수한 기술 검토 보고서에서도 “지난해부터 올해까지 생성형 AI 아키텍처 개발 동향을 보면 인코더는 단순한 보조 도구가 아닌 AI의 본질을 규정하는 핵심 추론 엔진으로 기능한다”며 “인코더-디코더 구조의 상호작용은 모델의 정교함을 결정한다”고 지적했다.
성낙호 네이버클라우드 하이퍼스케일 기술총괄이 12일 ‘독자 AI 파운데이션 모델’ 프로젝트의 주관사업자로 선정된 것에 대한 소감을 이야기하고 있다. 네이버클라우드 제공 |
네이버 사태의 핵심 쟁점은?
결국 문제가 되는 것은 네이버가 큐웬의 인코더를 차용한 것이 독파모 사업에 부합하느냐는 것이다. 정부도 사업 공고 당시 독자 AI 파운데이션을 두고 ‘모델의 설계부터 사전학습 과정 등을 수행한 국산 모델’이라고 명시한 바 있다. 업계 용어로 ‘프롬 스크래치’ 방식으로 개발된 AI만 허용된다는 것이다.
다만 프롬 스크래치의 기준이 명확하게 정의돼 있지 않은 것이 문제다. 업계에서도 의견이 갈리는 만큼 사업 주체인 과학기술정보통신부가 ‘교통 정리’를 해야 하는 상황이지만 여전히 정부는 이렇다 할 입장을 표명하고 있지 않다. 과기정통부 관계자는 “글로벌 기준이 명확하게 확립된 것이 아니기 때문에 전문 위원들이 다양한 평가 요인들에 따라 결정할 것”이라고 했다.
추후 라이센스 관련 문제가 발생할 수 있다는 우려도 나온다. 네이버가 차용한 큐웬의 AI 모델은 모두 오픈소스로 공개돼 있지만 향후 라이센스 비용을 요구하는 등의 문제가 발생할 수도 있다는 것이다. 과기정통부의 공고에는 ‘타사 모델에 대한 라이센싱 이슈 부재’가 필수 조건으로 안내돼 있다. 국내 업계 전문가는 “만약 네이버의 모델이 국가대표AI로 선발돼 국내 AI 생태계를 구축한 이후에 라이센스 비용을 요구하면 문제가 커진다”며 “이에 대한 확실한 대비책이 있어야 한다”고 지적했다.
과기정통부는 아직은 당초 계획대로 이달 15일까지 평가를 마무리하겠다는 계획이다. 프롬 스크래치에 대한 기준 설정없이 1차 평가를 진행한다는 것이다. 업계에서는 1차 평가 결과가 어떻게 나오든 후폭풍이 있을 수 있다고 보고 있다.
최지원 기자 jwchoi@donga.com
Copyright Ⓒ 동아일보. All rights reserved. 무단 전재, 재배포 및 AI학습 이용 금지

















































