30일 서울 삼성동 코엑스에서 열린 '독자 AI 파운데이션 모델' 프로젝트 1차 발표회에서 참석자들이 업스테이지 부스를 둘러보고 있다./연합뉴스 |
업스테이지가 독자 인공지능(AI) 모델 ‘솔라-오픈-100B(Solar-Open-100B)’를 공개하며 “한국의 문화와 한국어의 미묘한 뉘앙스까지 이해하는 가장 한국적인 AI를 만들겠다”고 밝혔다.
김성훈 업스테이지 대표는 30일 서울 삼성동 코엑스 오디토리엄에서 열린 ‘독자 AI 파운데이션 모델’ 프로젝트 1차 발표회에서 “업스테이지는 대기업들과 달리 지난 5년간 모두에게 도움이 되는 AI를 만들자는 한 가지 목표만 보고 달려왔다”고 말했다.
업스테이지가 이번 1차 공개에서 선보인 솔라-오픈 모델은 100B급(1000억) 대규모언어모델(LLM)이다. 김 대표는 “이번 모델은 단순 실험 단계를 넘어 실제 서비스와 업무 환경에 투입할 수 있는 수준까지 완성도를 끌어올렸다”며 “성능과 효율을 동시에 검증하는 데 초점을 맞췄다”고 말했다.
업스테이지는 솔라-오픈의 경쟁력으로 고품질 데이터 기반 한국어 이해력을 내세웠다. 김 대표는 “단순히 한국어를 잘하는 수준이 아니라 문맥과 감정, 뉘앙스를 이해하는 AI를 목표로 했다”며 존댓말과 반말의 차이, 상황에 따른 표현 변화, 단계적 사고가 필요한 질문에 대한 응답 능력 등을 강조했다.
모델 학습 과정에서는 자원 효율과 학습 안정성을 핵심 과제로 꼽았다. 김 대표는 “정부 지원 GPU로 학습한 만큼 자원 효율을 최우선으로 고려했다”며 “자동 장애 감지 및 대체 체계와 학습 최적화를 통해 대규모 GPU 환경에서도 전체 학습 기간을 크게 단축했다”고 말했다.
업스테이지는 이번 모델이 컨소시엄의 역할 분담 위에서 완성됐다는 점도 부각했다. 업스테이지 컨소시엄은 5개 정예팀 가운데 유일하게 스타트업으로만 구성된 팀이다.
학습 및 평가용 데이터는 플리토가 총괄 제공했다. 플리토는 다년간 축적한 다국어 데이터 구축과 운영 노하우를 바탕으로 고난도 학습 데이터와 실사용 평가 데이터, 시나리오 기반 품질 검증 데이터 등을 설계하고, 한국어의 문화적 배경과 맥락을 반영한 데이터로 모델 학습을 지원했다.
한편 대규모 학습 인프라 운영은 래블업이 맡았다. 김 대표는 “수천 대 GPU를 동시에 운용하는 환경에서는 작은 장애도 전체 학습 중단으로 이어질 수 있다”며 “래블업과 협력해 장애를 자동으로 감지하고 즉시 대체하는 시스템을 구축했다”고 밝혔다.
모델의 실사용 검증은 로앤컴퍼니, 마키나락스, 뷰노 등 다양한 도메인의 기관이 참여했다. 김 대표는 “각 기업이 실제 업무 환경에서 솔라-오픈-100B를 적용해 보며 활용 가능성을 검증했고, 이러한 피드백이 모델 완성도를 높이는 데 중요한 역할을 했다”고 말했다.
업스테이지는 솔라-오픈-100B를 특정 기업만 사용하는 폐쇄형 모델로 두지 않고, 다양한 활용 사례로 확산시키는 것을 목표로 한다. 김 대표는 컨소시엄과 함께 솔라-오픈을 활용한 응용 서비스도 준비 중이며, 데이원컴퍼니가 기획 중인 ‘전 국민 대상 해커톤’을 대표 사례로 소개했다. 또 모델 개발 과정에서 쌓은 기술 노하우를 10개 강연으로 나눠 공유하고 있으며, 현재 6강까지 진행됐다고 덧붙였다.
향후에는 검색과 팩트체크, 리서치, 문서 작성 등에서 사용자의 목표를 수행하는 에이전트형 활용으로 적용 범위를 넓혀갈 계획이다.
김 대표는 “우리가 만들고자 한 AI는 단순히 말을 잘하는 모델이 아니라 실제로 일을 잘하는 AI”라며 “특정 글로벌 기업을 따라가는 것이 아니라, 독자 기술로 글로벌 시장에서 경쟁할 수 있는 AI를 만들어가겠다”고 강조했다.
업스테이지는 차기 모델 계획도 공개했다. 내년에는 200B급 LLM으로 규모를 키우고, 15조 토큰 학습, 256K 컨텍스트, 한·영·일 3개 언어 지원을 추진하겠다고 밝혔다. 궁극적으로는 범용화와 보편화에 초점을 맞춰 모델을 300B급까지 확장하고 학습 데이터와 컨텍스트 범위도 함께 넓히겠다는 계획이다.
김 대표는 “우리의 목표는 하나”라며 “많은 컨소시엄과 함께 솔라 LLM으로 구글, 오픈AI와 경쟁할 수 있는 글로벌 AI 3강을 만들어가는 데 기여하겠다”고 덧붙였다.
정부는 내년 1월 중 1차 단계 평가를 통해 독자 AI 파운데이션 개발 참여팀의 성과와 향후 계획을 종합 점검하고, 결과에 따라 정예팀을 4팀으로 압축할 예정이다. 이후 6개월마다 심사를 진행해 정예팀 수를 1팀씩 줄이고, 2027년 최종적으로 2팀을 선정한다는 방침이다.
홍아름 기자(arhong@chosunbiz.com)
<저작권자 ⓒ ChosunBiz.com, 무단전재 및 재배포 금지>




























































