━
무슨 일이야
배경훈 LG AI연구원장. 사진 LG AI연구원 |
━
추론 AI, 그게 뭔데?
추론 AI는 기존 LLM(대형언어모델) 모델과 비교해 논리적 문제 해결 능력이 우수한 AI다. 전통적 사전 학습 방식 AI 모델은 질문이 주어졌을 때 패턴에 기반해 그 질문에 적절할 것으로 예측되는 답을 내놓는다. 많은 데이터를 학습해 확률적으로 정답일 가능성이 높은 답을 제시하는 것. 추론 AI는 한 발 더 나아간다. 인간의 사고 과정처럼 단계별로 답을 찾아가며 문제에 대한 답변을 내놓는다. 앞뒤 맥락과 논리적 규칙에 맞는지 확인하기 때문에 일반 AI 모델보다 문제 해결 능력, 특히 수학·과학 문제 풀이 능력이 뛰어나며 코딩에도 능하다. 자체 검증을 거치기 때문에 AI의 문제로 지적돼온 환각(그럴싸한 거짓말) 문제도 줄일 수도 있다.
딥시크의 추론 AI 모델 R1이 보여주는 추론 과정. 문제를 이해하는 과정에서 시작해 단계를 거쳐 답을 구해나간다. 딥시크 홈페이지 캡처 |
━
이게 왜 중요해
이 같은 특성으로 추론 AI는 AI 에이전트(비서) 시대를 열 수 있는 기술로 꼽힌다. 문제 해결 능력 자체가 일반 AI와 차원이 다르기 때문에 인간의 일을 대신해주는 AI 에이전트 서비스와 잘 맞는다. 또 인간과 비슷한 수준 AI인 AGI(범용인공지능) 개발로 가는 길을 앞당겨 줄 수 있다. 국내 AI 개발사 한 관계자는 “AI산업 분야 핵심 수익 모델로 꼽히는 AI에이전트 개발을 위해 꼭 필요한 기술”이라고 말했다.
이 때문에 미중 빅테크들은 추론 AI를 줄줄이 내놓으며 경쟁을 벌이고 있다. 그간 추론 AI는 논리적 맥락을 일일이 학습해야 하고, 개발 비용이 많이 든다는 이유로 빅테크들의 전유물로 여겨졌지만, 딥시크 등장 이후 분위기가 바뀌었다. 오픈AI는 지난해 9월 GPT-o1을 시작으로 현재 주력 모델인 GPT o3 미니까지 계속해서 추론 AI 모델을 내놨다. 구글은 지난해 12월, 일론 머스크의 xAI는 지난 2월 추론 특화 모델을 내놓았고, 메타와 아마존도 올 상반기 추론 능력이 탑재된 AI 모델을 출시할 예정이다. 중국에선 지난 1월 딥시크가 R1을 선보였고, 알리바바는 지난 6일(QwQ), 바이두는 16일(어니 X1) 추론 AI를 공개했다. LG AI연구원은 “AI 에이전트는 스스로 가설을 세우고 이를 검증하기 위한 추론 과정을 통해 자율적으로 의사결정을 할 수 있는 능동적인 AI”라며 이를 구현하기 위해 추론 AI 개발이 필수”라고 밝혔다.
━
한국 상황은
국내에서도 네이버, AI 스타트업 업스테이지, 라이너 등이 추론 AI 모델을 개발 중이다. 네이버는 지난 20일 하이퍼클로바X를 업데이트하며 “추론 능력을 고도화해 요청한 작업을 체계적으로 수행할 수 있는 기술을 개발 중”이라고 밝혔다. 내부적으론 완성단계로 알려져 있다.
■ 더중앙플러스 : 팩플
딥시크 쇼크? 4대천왕 더 있다…中 10년간의 ‘치밀한 빌드업’ [딥시크 스톰①]
https://www.joongang.co.kr/article/25311292
AI 미래는 ‘추론 맛집’ 경쟁…‘전성비’ 칩 회사들 돈 번다 [딥시크 스톰②]
https://www.joongang.co.kr/article/25311842
“네 답변은 10점 만점에 4점” 똑똑한 챗GPT 만들 조련법
https://www.joongang.co.kr/article/25297596
김민정 기자 kim.minjeong6@joongang.co.kr
▶ 중앙일보 / '페이스북' 친구추가
▶ 넌 뉴스를 찾아봐? 난 뉴스가 찾아와!
ⓒ중앙일보(https://www.joongang.co.kr), 무단 전재 및 재배포 금지