‘국가대표 AI’ 선발전에 갑자기 등장한 패자부활전… 역량 있는 기업 추가 지원 : zum 뉴스

정부가 ‘국가대표 AI(인공지능) 모델 프로젝트’에 참여한 5개 정예팀 중 네이버클라우드와 NC AI를 1차 탈락시켰다. 당초 정부는 5개팀을 4개팀으로 압축시키려 했지만, 한꺼번에 2개팀이 탈락하게 됐다. NC AI 정예팀은 벤치마크·전문가 평가·사용자 평가에서, 네이버클라우드는 독자성 요건을 충족하지 못해 경쟁에서 빠지게 됐다. 정부는 업스테이지, SK텔레콤, LG AI연구원만 정예팀에 남게 되자 패자부활전을 하겠다고 발표했다. 공정성, 형평성 논란이 불가피할 전망이다.

류제명 과학기술정보통신부 2차관은 15일 오후 정부서울청사에서 열린 ‘독자 AI 파운데이션 모델 프로젝트 1차 단계 평가 결과’ 브리핑에서 “소수 경쟁 압축 방식으로 하자는 취지가 최종적인 두 기업을 선정하는 목표보다는 가장 치열한 경쟁 환경을 만들어 짧은 기간에 많은 성과를 낼 수 있는 구도를 설계하는 것”이라고 설명했다. 국가대표 AI 모델 프로젝트는 한국만의 주체적인 AI 모델을 구축한다는 목표로 그래픽처리장치(GPU)와 데이터 등 자원을 집중 지원하는 정부의 핵심 사업이다.

정부는 1차 평가에서 탈락한 네이버클라우드, NC AI 정예팀은 물론 정예팀 선발에 뽑히지 못한 모티프테크놀로지스, 카카오, KT, 코난테크놀로지, 카이스트 컨소시엄과 이외 모든 기업들에게 다시 기회를 준다고 했다. 추가로 선발되는 정예팀은 1단계를 통과한 정예팀과 마찬가지로 GPU, 데이터 지원은 물론 K-AI 기업 명칭 사용도 가능하다.

일각에서는 정부가 네이버클라우드를 위한 명분을 만든 것 아니냐고 지적한다. 정부가 세부 평가의 기업별 순위도 발표하지 않았기 때문이다. 이달 초 네이버클라우드는 ‘하이퍼클로바X 시드 32B 싱크’ 모델의 이미지·음성 인코더가 중국 알리바바의 ‘큐웬(Qwen) 2.5 ViT’을 베꼈다는 의혹을 받았다. 네이버 측은 “기술적 자립도가 부족해서가 아니라, 이미 표준화된 고성능 모듈을 활용해 전체 모델의 완성도와 안정성을 높이기 위해 외부 인코더를 전략적으로 채택했다”고 해명했다. 네이버클라우드 측은 이날 “과기정통부의 판단을 존중하고 재도전은 고려하지 않는다”고 했다.

다음은 류제명 과기정통부 2차관, 김경만 과기정통부 인공지능정책실장의 주요 질의응답.

그래픽=정서희

◇ “새 정예팀 공모 조속히 진행... 동일 GPU, 데이터 기간 줄 것”

―추가로 1개팀을 모집하는 기준이나 심사 시기가 궁금하다.

“네번째 자리가 공석이라는 예기치 못한 상황이 발생했기 때문에 2단계에 참여할 새로운 기업을 공모하는 과정은 최대한 빨리 행정절차를 마무리할 것이다. 2단계에 참여하지 못한 (탈락) 기업뿐 아니라 1단계 평가에 합류하지 못한 10개 컨소시엄 그리고 또 새롭게 컨소시엄을 구성할 역량 있는 기업들에게 기회를 줄 것이다.”

―패자부활전을 하겠다는 것인데, 추가로 선발되는 정예팀은 시간적 격차가 있다. 어떤 이점을 줄 것이냐.

“추가로 참여하는 기업에게도 총 프로젝트 기간 사용할 수 있도록 정부가 지원하는 GPU, 데이터를 동일하게 설계해서 제공을 할 것이다. 평가 기간이나 프로젝트 종료 시점은 다르더라도 동일한 기간에 2단계를 마치게 할 것이다. 기간의 순서 차이가 있더라도 기간 차이에 대해서는 유연하게 관리를 할 계획이다.”

―2차 평가 일정과 향후 로드맵은.

“(1차 단계 평가를 통과한) 3개팀은 2단계를 바로 시작할 수 있도록 할 것이다. 정부가 임차한 GPU를 가지고 참여 기업들이 쓸 수 있도록 제공하고 있는데 (1단계에서 합격한) 3개 정예팀들이 나머지 추가 정예팀을 기다리게 되면 임차한 GPU 자원을 놀려야 되는 상황이라 예산 낭비가 된다. (다만 추가 선발된 정예팀은) 프로젝트 참여 기간과 제공되는 총 GPU 양 등을 먼저 출발한 3개 정예팀과 동일한 조건에서 할 수 있도록 설계하고 있다.”

류제명 과학기술정보통신부 2차관이 15일 서울 종로구 정부서울청사에서 독자 AI 파운데이션 모델 프로젝트 1차 단계 평가 결과를 브리핑하고 있다. /뉴스1

◇ “네이버 기술 요건 미흡, 사업종료 이후 소명자료 보내”

―네이버클라우드가 탈락한 것에 대해 좀 더 구체적으로 설명해달라.

“문제가 된 인코더에 대해서 기술적·정책적·윤리적 측면에서 세분화해서 평가를 분석했다. (프로젝트) 공모 안내서에 독자 AI 파운데이션 모델이 갖춰야 될 기본적인 조건들이 포함됐다. 우리가 본질적으로 독자 AI 파운데이션 모델에서 지향하는 것은 어떤 조건에서도 처음부터 스스로 직접 설계하고 학습을 한 것들(인데, 네이버클라우드가 이를) 충족하지 못한다는 점이 (탈락) 사유가 됐다. 다수의 평가위원들도 네이버클라우드가 프로젝트가 지향하는 부분의 기술적 요건에 미흡했다고 지적했다. 외부 인코더를 활용하는 것이 개발 단계에서 일반적으로 활용하는 방법이긴 하지만, 이번에 판단할 때는 인코더를 활용했을 때 가중치를 업데이트할 수 있는 형태가 아니라 프로즌(고정)돼 있는 형태였기 때문에 외부의 인코더와 가중치를 그대로 활용한 것은 독자 파운데이션 모델로 인정하기 어렵다는 내부 판단이 있었다.”

―네이버에서 인코더 문제에 대해 사전에 질의가 있었는지.

“없었다. 참고로 논란이 되고 나서 네이버 측에서 소명서를 보내 왔다. 여러 가지 판단의 문제나 또 보는 관점에 따라서 여러 가지 해석의 여지가 있는 지점들이 있었다. 중요한 것은 소명이 지난해 12월 31일 사업 종료 이전에 이뤄지지 않고 평가가 진행 중인 상황에 보내와 반영하지 않았다. 이미 절차적으로 끝난 이후에 받은 (소명자료를) 사업 종료 이후 평가에 반영한다는 것은 여러 가지 절차적인 문제가 있다고 판단을 했다. 네이버 측에서는 자체 보유한 인코더도 있고, 또 지금 사용한 인코더가 프로젝트에서 차지하는 비중이 상당히 낮다는 내용으로 소명을 했다. 여러 가지 견해 차이가 있고 전문가들이 보는 관점이 다르다.”

―외부 인코더 활용 가능 여부 같은 세부 기준이 첫 공모 당시에는 들어갈 수 없었을 것이다. 앞으로 독자성 판단에 대한 명확한 가이드라인을 줄 것인가.

“전 세계적으로도 글로벌 기업을 포함해 오픈소스를 활용하지 않는 기업은 없다고 봐도 괜찮다. 오픈소스를 죄악시한다는 것으로 보지 말아야한다. 각 단계별로 오픈소스의 라이선싱 조건에 따라서 적절하게 가장 전략적으로 활용하는 것이 AI 생태계에서 당연한 것이다. 다만 독자 AI 파운데이션 모델 프로젝트에서 우리가 해보자고 하는 것은 그럼에도 우리 스스로 모델도 설계해 보고, 또 오픈소스를 가져다 쓰더라도 학습이 이미 된 가중치가 만들어진 것을 그대로 갖다 쓰는 것은 남의 경험을 어떻게 보면 무임승차하는 것이다. 우리는 학습 경험 자체를 새롭게 해보자는 것이다. 그래야 앞으로 우리가 오픈소스를 활용하더라도 더 경쟁력 있는 AI 모델을 만들 수 있다. AI 경쟁 속도가 빠르다 보니 모든 게 확실해졌을 때 이런 프로젝트를 시작하기보다는 여러 가지 불확실성이 아직 있지만 빨리 출발하고 보완해가는 과정이 있다. 개발 과정에 있어서 계속 맞춰 가면서 정부도 관리하고 사업자들도 정부와 커뮤니케이션해서 진행을 해왔다. 평가와 관련해서도 기준과 방법 모든 것을 정예팀들하고 협의하에 상호 도출할 수 있는 공감대를 (찾고자 했고) 최대한 맞추고 합의한 수준에서 했다.”

◇ 패자부활전 형평성 논란 예상

―원래 과락이라는 게 있었나. 네이버클라우드, NC AI도 추가로 지원해 부활할 수 있다고 했는데 이들이 부활하거나 새로운 팀이 합류했을 때 2단계에서 패널티는 없느냐.

“소수 경쟁 압축 방식으로 하자는 취지가 최종적인 두 기업을 선정하는 목표보다는 가장 치열한 경쟁 환경을 만들어서 짧은 기간에 많은 성과를 낼 수 있는 구도를 설계하는 것이다. 직접적으로 참여하지 않는 기업도 자극이 돼 (기술을) 추격하는 자극이 있다고 판단했다. 모티프테크놀로지나 KT 같은 경우에도 1라운드 본선에 진출하지 못했지만 기술개발에 박차를 가해서 글로벌 AI 성능 평가 기관 ‘아티피셜 어낼리시스(Artificial Analysis)’에 상위권에 드는 성과를 보여줬다. 그런 취지에서 1단계 평가 결과는 2단계에 전혀 영향을 받지 않도록 새롭게 출발, 재도전을 할 수 있도록 하려한다.”

―패자부활전이 참여한 다른 정예팀에게 형평성 논란을 줄 수 있지 않나. 어떻게 보면 떨어진 2개 사업자 중 누군가에게 기회를 주는 것 아닌가 해석된다. 추가로 정예팀을 선정하는 것은 소모적이지 않나.

“1차 단계에 참여하지 못한 기업들에도 가용할 수 있는 자원을 활용해 특화 분야에 대한 파운데이션 모델 사업을 만들어 2개의 컨소시엄을 해나가고 있다. 우리가 갖고 있는 GPU 자원과 예산도 한계가 있지만, 자원의 제약하에서 최대한 많은 AI 기업들한테 어떤 방식으로든 GPU를 많이 써보게 하고 AI 기술개발에 참여할 수 있는 조건을 만든다는 것이 1단계 평가의 배경이다. 이 과정에서 얻은 게 많다. 절대 특정 기업을 배려하거나 특정 기업을 위해 급조된 접근 방법이 아니다. 모든 참여 기업한테도 개별적으로들 다 협의하고 (형성된) 공감대가 이 기업들이 만들어낸 성과 자체도 개별 특정 기업의 소유물이 되어서도 안된다. 우리나라의 많은 AI 서비스 기업들이 활용할 수 있는 그런 오픈소스로 기여를 해야 한다. 지금 패자부활전 용어를 쓰는 대신에 재도약, 추격, 재도전 프로그램이라 표현해주면 좋겠다.”

―네이버클라우드만 프롬 스크래치 이슈가 있던 것은 아니다. 다른 정예팀에 대해서도 동일한 잣대가 적용되고 이견이 없었는지.

“업스테이지 같은 경우도 레퍼런스 언급 문제에서 평가위원들이 지적했다. 우리가 독자 파운데이션 모델의 기준을 삼을 때 윤리적 기준에서 공개된 오픈소스를 쓸 때도 당당하게 어떻게 썼고 그리고 어떤 부분을 고쳤는지 기술적으로 검증을 거칠 때 대한민국 인공지능 생태계가 더 발전한다고 생각을 했다. 그런 측면에서 본다면 업스테이지의 레퍼런스 비언급 문제도 사실상 우리 기준에 부합하지 않다고 볼 수는 있다. 하지만 그게 당락을 결정할 정도의 아주 큰 하자라고 전문가들이 지적하지 않았다. SK텔레콤도 그런 측면에서 약간의 지적이 있기는 했다. 하지만, 그것이 절대적인 평가 기준이 아니었다.”

―평가기준은 2차 때도 같나.

“벤치마크, 전문가, 사용자 평가 큰 틀은 변화가 없을 것 같다. 하지만 프롬 스크래치에 대한 부분은 좀 더 학계나 업계 그리고 전문가 의견을 수렴해 정도에 따른 차등, 배점을 더 구체화시키려 한다. 다만 여전히 불확실성은 있을 것이다. 우리가 추가적으로 GPU를 더 확보하면 이를 더 공급할 수도 있다. 정해진 것은 아니지만, 그래서 목표치를 더 높일 수도 있다. 또 AI 글로벌 기업들의 경쟁 상황에 적응하고 수용해가면서 다이내믹하게 가는 것도 좋지 않을까 생각된다.”

안상희 기자(hug@chosunbiz.com)

<저작권자 ⓒ ChosunBiz.com, 무단전재 및 재배포 금지>

‘국가대표 AI’ 선발전에 갑자기 등장한 패자부활전… 역량 있는 기업 추가 지원

AI 이슈 트렌드

조선비즈 하이라이트

실시간 인기 뉴스

주요 뉴스

파워링크

당신만의 뉴스 Pick

독자의 Pick

포토 뉴스

쇼핑 핫아이템