[팩플] LG가 내놨다…수능 수학 94.5점 추론 AI

중앙일보

입력: 2025-03-18 18:06

LG AI연구원이 국내 첫 추론 인공지능(AI) 모델 ‘엑사원 딥’을 공개했다. 더 적은 매개변수(AI 연산 능력을 수치화한 지표)로 글로벌 추론 AI 모델과 비슷한 성능을 구현했다. ‘딥시크 쇼크’ 이후 미중 빅테크 간 추론 AI 성능 개선 경쟁이 불붙은 가운데, 국내 기술기업들도 일제히 추격에 나서고 있다.

━

무슨 일이야

LG AI연구원은 18일(현지시간) 미국 캘리포니아주 새너제이에서 열린 엔비디아 개발자 콘퍼런스(GTC)에서 ‘엑사원 딥’을 발표했다. 국내 기업 중 처음 선보이는 추론 AI다. 함께 공개된 기술 보고서에 따르면 ‘엑사원 딥-32B’(매개변수 320억개)는 중국 딥시크의 R1(6710억개 매개변수) 대비 5% 수준 매개변수(AI 연산 능력을 수치화한 지표)만 사용했는데도, 수학 능력을 나타내는 ‘AIME(미국 수학경시대회) 2025’에서 딥시크와 동일한 80.0을 기록했다. 과학 및 코딩 분야에서도 딥시크와 유사한 결과를 냈다. 한국어에 강점이 있는 모델 기반으로 만든 만큼 국내 2025학년도 수능 수학 영역에서 94.5점을 기록했고, 선택과목(확률과 통계·미적분·기하) 모두에서 1등급을 달성했다.

배경훈 LG AI연구원장. 사진 LG AI연구원

━

추론 AI, 그게 뭔데?

추론 AI는 기존 LLM(대형언어모델) 모델과 비교해 논리적 문제 해결 능력이 우수한 AI다. 전통적 사전 학습 방식 AI 모델은 질문이 주어졌을 때 패턴에 기반해 그 질문에 적절할 것으로 예측되는 답을 내놓는다. 많은 데이터를 학습해 확률적으로 정답일 가능성이 높은 답을 제시하는 것. 추론 AI는 한 발 더 나아간다. 인간의 사고 과정처럼 단계별로 답을 찾아가며 문제에 대한 답변을 내놓는다. 앞뒤 맥락과 논리적 규칙에 맞는지 확인하기 때문에 일반 AI 모델보다 문제 해결 능력, 특히 수학·과학 문제 풀이 능력이 뛰어나며 코딩에도 능하다. 자체 검증을 거치기 때문에 AI의 문제로 지적돼온 환각(그럴싸한 거짓말) 문제도 줄일 수도 있다.

딥시크의 추론 AI 모델 R1이 보여주는 추론 과정. 문제를 이해하는 과정에서 시작해 단계를 거쳐 답을 구해나간다. 딥시크 홈페이지 캡처

━

이게 왜 중요해

이 같은 특성으로 추론 AI는 AI 에이전트(비서) 시대를 열 수 있는 기술로 꼽힌다. 문제 해결 능력 자체가 일반 AI와 차원이 다르기 때문에 인간의 일을 대신해주는 AI 에이전트 서비스와 잘 맞는다. 또 인간과 비슷한 수준 AI인 AGI(범용인공지능) 개발로 가는 길을 앞당겨 줄 수 있다. 국내 AI 개발사 한 관계자는 “AI산업 분야 핵심 수익 모델로 꼽히는 AI에이전트 개발을 위해 꼭 필요한 기술”이라고 말했다.

이 때문에 미중 빅테크들은 추론 AI를 줄줄이 내놓으며 경쟁을 벌이고 있다. 그간 추론 AI는 논리적 맥락을 일일이 학습해야 하고, 개발 비용이 많이 든다는 이유로 빅테크들의 전유물로 여겨졌지만, 딥시크 등장 이후 분위기가 바뀌었다. 오픈AI는 지난해 9월 GPT-o1을 시작으로 현재 주력 모델인 GPT o3 미니까지 계속해서 추론 AI 모델을 내놨다. 구글은 지난해 12월, 일론 머스크의 xAI는 지난 2월 추론 특화 모델을 내놓았고, 메타와 아마존도 올 상반기 추론 능력이 탑재된 AI 모델을 출시할 예정이다. 중국에선 지난 1월 딥시크가 R1을 선보였고, 알리바바는 지난 6일(QwQ), 바이두는 16일(어니 X1) 추론 AI를 공개했다. LG AI연구원은 “AI 에이전트는 스스로 가설을 세우고 이를 검증하기 위한 추론 과정을 통해 자율적으로 의사결정을 할 수 있는 능동적인 AI”라며 이를 구현하기 위해 추론 AI 개발이 필수”라고 밝혔다.

━

한국 상황은

국내에서도 네이버, AI 스타트업 업스테이지, 라이너 등이 추론 AI 모델을 개발 중이다. 네이버는 지난 20일 하이퍼클로바X를 업데이트하며 “추론 능력을 고도화해 요청한 작업을 체계적으로 수행할 수 있는 기술을 개발 중”이라고 밝혔다. 내부적으론 완성단계로 알려져 있다.

■ 더중앙플러스 : 팩플

딥시크 쇼크? 4대천왕 더 있다…中 10년간의 ‘치밀한 빌드업’ [딥시크 스톰①]

https://www.joongang.co.kr/article/25311292

AI 미래는 ‘추론 맛집’ 경쟁…‘전성비’ 칩 회사들 돈 번다 [딥시크 스톰②]

https://www.joongang.co.kr/article/25311842

“네 답변은 10점 만점에 4점” 똑똑한 챗GPT 만들 조련법

https://www.joongang.co.kr/article/25297596

김민정 기자 kim.minjeong6@joongang.co.kr

▶ 중앙일보 / '페이스북' 친구추가

▶ 넌 뉴스를 찾아봐? 난 뉴스가 찾아와!

ⓒ중앙일보(https://www.joongang.co.kr), 무단 전재 및 재배포 금지

이 기사의 카테고리는 언론사의 분류를 따릅니다.

기사가 속한 카테고리는 언론사가 분류합니다.
언론사는 한 기사를 두 개 이상의 카테고리로 분류할 수 있습니다.

ZUM 뉴스

[팩플] LG가 내놨다…수능 수학 94.5점 추론 AI

무슨 일이야

추론 AI, 그게 뭔데?

이게 왜 중요해

한국 상황은

중앙일보 주요뉴스

이 기사를 본 사람들이 선택한 뉴스

쇼핑 핫아이템

글자크기 조절

[팩플] LG가 내놨다…수능 수학 94.5점 추론 AI

무슨 일이야

추론 AI, 그게 뭔데?

이게 왜 중요해

한국 상황은

중앙일보 주요뉴스

이 기사를 본 사람들이 선택한 뉴스

쇼핑 핫아이템

공유하기

글자크기 조절