LG AI연구원은 17∼21일(현지시간) 미국 캘리포니아주 새너제이에서 열리는 엔비디아의 연례 개발자 콘퍼런스(GTC)에서 엑사원 딥을 공개한다고 이날 밝혔다.
LG는 “현재 전 세계적으로 미국의 오픈AI와 구글, 중국의 딥시크와 알리바바 등 파운데이션 모델을 보유한 소수의 기업만이 자체 추론 AI를 개발하고 있다”며 “엑사원 딥은 이들과 경쟁할 수 있는 국내 첫 모델”이라고 소개했다. 추론 AI는 단계적인 사고 과정을 통해 논리적인 답변을 하는 AI로, 스스로 가설을 세워 검증하고 자율적인 의사결정이 가능한 ‘에이전틱 AI’의 핵심 토대가 된다.
두 모델은 체급 차이가 큰데도 성능은 비슷하거나 엑사원 딥이 더 우수한 것으로 나타났다.
2025학년도 수능 수학 영역으로 문제 해결 능력을 평가한 결과 엑사원 딥은 딥시크 R1(89.9점)보다 높은 94.5점을 받았다.
엑사원 딥은 확률과 통계, 미적분, 기하 등 선택과목 또한 각각 95점, 95.1점, 93.5점으로 1등급을 맞았다. 반면 딥시크 R1은 90.8점, 89.4점, 89.6점 등 90점 내외에 머물렀다.
과학 문제 해결 능력을 평가하는 GPQA 다이아몬드 테스트에서도 엑사원 딥은 66.1점으로 매개변수 규모가 비슷한 알리바바의 ‘QwQ-32B’(63.3) 등보다 점수가 높았다.
딥시크 R1은 해당 테스트에서 71.5점으로 앞서갔다. 다만 인간 중 최고 전문가가 받을 수 있는 최고점이 69.7점으로 보는 만큼, 엑사원 딥이 딥시크 R1의 5%에 불과한 규모로 최고 전문가에 근접한 결과를 낸 것은 의미가 크다는 분석이 나온다.
엑사원 딥은 인프라 효율도 뛰어난 것으로 알려졌다. 딥시크 R1을 구동하려면 엔비디아의 주력 AI칩인 H100이 16개 필요한데, 엑사원 딥은 한 개면 구동 가능해서다.
LG AI연구원은 “엑사원 딥이 수학과 과학 등 전문 분야 평가 지표에서 높은 성능을 보여준 만큼, 향후 기업이 필요로 하는 전문 분야뿐 아니라 물리·화학 등 과학 연구와 교육 현장에서도 활용도가 높아질 것”이라고 기대했다.
엑사원 딥은 오픈소스 공개와 함께 미국 비영리 AI 연구·조사 기관 에포크 AI가 선정하는 ‘주목할 만한 AI’에 이름을 올렸다. 해당 리스트엔 지난달 LG AI연구소의 ‘엑사원 3.5 32B’도 포함됐다. 2023년 이래 국내 기업이 이 분야에 등재된 건 LG AI연구원이 유일하다.
이동수 기자 ds@segye.com
ⓒ 세상을 보는 눈, 세계일보