업스테이지 솔라 오픈 공개 검증회. 업스테이지 제공 |
국가대표 인공지능(AI)기업 업스테이지의 독자 인공지능 모델인 ‘솔라 오픈’이 ‘중국산 모델 도용’ 논란에 휩싸이면서 논란이 일자, 2일 공개 검증회를 자청해 의혹을 정면으로 반박하고 나섰다. 솔라 오픈은 새로운 모델로 중국산 인공지능 도용 의혹은 사실이 아니라는 것이다.
이번 논란은 인공지능 스타트업 사이오닉에이아이(AI)의 고석현 대표가 문제를 제기하며 불거졌다. 고 대표는 지난 1일 페이스북과 링크드인에 “국민 세금이 투입된 프로젝트에서 중국 모델을 복사하여 미세 조정한 결과물로 추정되는 모델이 제출된 것은 유감”이라며 업스테이지의 솔라 오픈과 중국의 인공지능 스타트업 지푸에이아이에서 만든 지엘엠 4.5 에어(GLM-4.5-Air)의 유사도를 비교한 분석 글을 게시했다. 해당 글은 두 모델이 유사하다는 근거로 레이어정규화(LayerNorm) 파라미터(매개변수)의 코사인유사도(방향성의 유사도를 알 수 있음)를 비교하며 96.8% 동일하다는 내용이다.
업스테이지는 글로벌 인공지능 3강을 목표로 하는 정부가 국내 기업의 인공지능 개발을 지원하기 위해 지난해 6월 착수한 ‘독자 인공지능 파운데이션 모델 프로젝트’에 참여 중인 ‘국가대표 5개 정예팀’ 가운데 한 팀이다. 솔라 오픈은 이 사업의 일환으로 만들어진 인공지능 모델이다. 한국의 독자 인공지능 기술력 확보를 위해 국가에서 세금을 지원해 만들어졌다. 기술적 독립성을 확보한 모델이 아니고 ‘중국 모델의 복제본’이란 의혹이 사실로 드러나면, 개발사인 업스테이지는 물론 지난 6월부터 평가를 이어오며 이 기업을 최종 5개 정예팀 가운데 하나로 선정한 정부 사업 자체의 신뢰도에도 타격이 불가피하다. 이에 김성훈 업스테이지 대표는 해당 글에 곧바로 댓글을 달고 공개 검증을 제안했다.
고석현 대표 페이스북 갈무리 |
업스테이지는 이날 업계 및 정부 관계자 70여명을 초청한 공개검증회에서 해당 의혹은 사실이 아니라고 반박했다. 직접 해명에 나선 김 대표는 “프롬스크래치(아무것도 없는 상태에서 처음부터 만드는 것) 여부를 결정하는 것은 학습에 쓰이는 가중치(모델이 학습한 중요도 수치)를 무작위로 초기화하고 직접 학습을 했는지 여부”라며 “모델 구조는 표준화돼서 거의 대동소이하다. 옛날 로마에서 길의 너비를 정하면 마차 바퀴가 길에 맞춰 만들어지는 것과 같은 원리”라고 말했다.
김 대표는 고 대표가 제기한 “일부 코드에서 지푸에이아이의 저작권을 뒤늦게 기재했다”는 주장에 대해서도 “허깅페이스(인공지능 모델 오픈소스 커뮤니티)의 코드를 쓴 것이고 구조 자체는 지엘엠에 저작권이 있는 것도 아니다. 지피티 오에스에스(GPT-OSS, 오픈에이아이의 오픈소스모델)의 구조를 참고한 것”이라고 말했다. 그는 이어 “독자 파운데이션 모델 평가 마감 마지막 1분까지 모델 가중치를 학습하는 데 집중하다 보니 라이센스 표기에 신경을 꼼꼼히 쓰지 못했다”고 해명했다. 해당 코드를 사용할 때 지켜야 하는 사용권의 표기법상 실수를 한 정도란 뜻이다.
업계에서도 비슷한 분석이 이어졌다. 인공지능 스타트업 포티투마루의 이승현 부사장은 페이스북을 통해 “구조가 비슷하고 학습 방식이 유사하면 서로 다른 모델이라도 레이어 정규화 값이 비슷해진다”며 “구조적 유사성은 표절이 아니고 사용성과 호환성을 고려한 설계 선택”이라고 말했다. 인공지능 개발의 표준 방식을 따라 만들면 생기는 일이라는 이야기다.
업스테이지 솔라 오픈 공개검증회에서 발표를 진행 중인 김성훈 대표. 업스테이지 유튜브 화면 갈무리 |
업스테이지는 중국산 도용 주장을 반박하는 한편 솔라 오픈 모델 학습에 사용한 기록인 체크포인트와 완디비(Wandb·모델 학습 과정 기록이 담긴 개발 플랫폼)기록도 이날 모두 공개했다. 이날 검증회 실시간 중계에는 2천명 가까운 인원이 참여해 높은 관심을 보였다.
의혹을 제기한 고석현 대표는 이런 반박이 나온 뒤 “구조적으로 유사한 모델의 경우 (해당 값이)높은 유사도를 보일 수 있다”고 인정하고, 문제를 제기했던 글을 내렸다. 업스테이지는 고 대표를 공개검증회에 초청했으나, 고 대표는 출장을 이유로 참석하지 않았다.
독자 인공지능 파운데이션 모델 프로젝트를 진행하는 과학기술정보통신부 관계자는 “해당 논란에 대해 알고 있다”며 “정예팀 평가 과정에서 파운데이션 모델에 대해서도 입체적으로 검증에 들어간다”고 밝혔다. ‘독자 인공지능 파운데이션 모델 프로젝트’는 2027년 상반기에 최종 2개 팀으로 추려지며, 이달 진행될 첫 평가에서 5개팀 중 1개의 팀이 탈락하게 된다.
채반석 기자 chaibs@hani.co.kr
[한겨레 후원하기] 시민과 함께 민주주의를
겨울밤 밝히는 민주주의 불빛 ▶스토리 보기
▶▶한겨레 뉴스레터 모아보기






























