[최진홍 기자] 지금까지의 인공지능(AI)이 유창하게 대답하는 학생이었다면 이제는 스스로 생각하고 문제를 해결하는 전문가가 우리 곁으로 다가왔다. 국내 AI 대표 주자 업스테이지가 10일 차세대 거대언어모델(LLM) '솔라 프로 2'를 공식 출시하며 'AI 에이전트' 시대의 개막을 알렸다. 이는 단순히 성능을 개선한 모델이 아니라 AI의 역할 자체를 재정의하는 중대한 이정표다.
솔라 프로 2의 가장 큰 혁신은 사용자가 AI의 사고방식을 직접 선택할 수 있는 '하이브리드 모드'의 도입이다. 빠른 응답이 필요할 땐 '챗 모드'를 일상적인 대화처럼 사용하고 복잡한 문제 앞에서는 '추론 모드'를 선택해 AI가 단계적으로 사고하는 과정을 거쳐 정교한 해답을 내놓게 할 수 있다. '생각의 사슬(Chain of Thought)' 기법이 적용된 추론 모드는 특히 수학이나 코딩 같은 고도의 논리가 필요한 작업에서 탁월한 능력을 발휘한다.
그 성능은 이미 세계 최고 수준과 어깨를 나란히 한다. 업스테이지는 매개변수 규모를 기존 220억개에서 310억개로 확장하며 '종합지식(MMLU-Pro)' '수학(Math500, AIME)' '코딩(SWE-Bench)' 등 고난도 추론 벤치마크에서 GPT-4o 딥시크 R1 등 글로벌 프런티어급 모델에 필적하는 점수를 기록했다. 자체 기술로 구현한 LLM이 세계 최상위권과의 성능 격차를 사실상 없앴다는 점에서 의미가 크다.
솔라 프로 2의 가장 큰 혁신은 사용자가 AI의 사고방식을 직접 선택할 수 있는 '하이브리드 모드'의 도입이다. 빠른 응답이 필요할 땐 '챗 모드'를 일상적인 대화처럼 사용하고 복잡한 문제 앞에서는 '추론 모드'를 선택해 AI가 단계적으로 사고하는 과정을 거쳐 정교한 해답을 내놓게 할 수 있다. '생각의 사슬(Chain of Thought)' 기법이 적용된 추론 모드는 특히 수학이나 코딩 같은 고도의 논리가 필요한 작업에서 탁월한 능력을 발휘한다.
그 성능은 이미 세계 최고 수준과 어깨를 나란히 한다. 업스테이지는 매개변수 규모를 기존 220억개에서 310억개로 확장하며 '종합지식(MMLU-Pro)' '수학(Math500, AIME)' '코딩(SWE-Bench)' 등 고난도 추론 벤치마크에서 GPT-4o 딥시크 R1 등 글로벌 프런티어급 모델에 필적하는 점수를 기록했다. 자체 기술로 구현한 LLM이 세계 최상위권과의 성능 격차를 사실상 없앴다는 점에서 의미가 크다.
한국어 능력은 경쟁자를 뛰어넘는 수준이다. '인간 선호도(Arena-Hard-Auto)' '해례(Hae-Rae)' 등 주요 한국어 벤치마크에서 글로벌 모델들보다 높은 점수를 획득했다. 이는 단순한 언어 번역을 넘어 우리 문화의 미묘한 맥락까지 이해하고 금융 의료 법률 같은 전문 분야에서도 높은 실효성을 보인다는 뜻이다.
솔라 프로 2가 꿈꾸는 미래는 '말을 잘하는 AI'를 넘어 '일을 해내는 AI'다. 사용자의 의도를 파악하고 외부 도구를 활용해 실행 가능한 결과물을 만드는 '에이전트형 LLM'으로 진화했기 때문이다. 예를 들어 "최근 3개월간 경쟁사 신제품 동향을 조사하고 관련 기사 링크를 포함한 PPT 초안을 작성해줘"라고 명령하면 솔라 프로 2는 스스로 실시간 웹 검색으로 데이터를 수집하고 분석해 발표 자료까지 자율적으로 만들어낸다.
업스테이지 김성훈 대표는 "솔라 프로 2는 단순히 말을 잘하는 AI를 넘어 문제를 이해하고 논리적으로 사고하며 실질적인 행동까지 수행하는 'AI 에이전트' 시대의 차세대 언어모델"이라며 "업스테이지는 자체 기술로 구현한 세계 최고 수준의 LLM을 기반으로 AI가 업무 방식을 근본적으로 혁신하고 나아가 '일의 미래'를 앞당길 수 있도록 지속적으로 기술을 발전시켜 나가겠다"고 밝혔다. 그의 말처럼 솔라 프로 2의 등장은 AI가 우리의 일상과 업무에 깊숙이 들어와 실질적인 조력자가 되는 미래가 성큼 다가왔음을 알리는 신호탄이다.
<저작권자 Copyright ⓒ 이코노믹리뷰 무단전재 및 재배포 금지>




























































