컨텐츠로 건너뛰기
뉴스
서울
맑음 / -3.9 °
파이낸셜뉴스 언론사 이미지

카카오, '저비용 고효율' 카나나 4종 오픈소스 모델 추가 공개

파이낸셜뉴스 주원규
원문보기
카카오 제공

카카오 제공


[파이낸셜뉴스] 카카오가 자체 인공지능(AI) 기술력을 기반으로 개발한 차세대 언어모델 ‘카나나-2’를 업데이트하고, 4종의 모델을 오픈소스로 추가 공개했다고 20일 밝혔다.

이번에 공개한 4종의 모델은 △기본(Base) 모델 △지시 이행(Instruct) 모델 △추론 특화(Thinking) 모델 △미드 트레이닝(Mid-training) 모델 등이다.

이 모델들은 실질적인 에이전틱 AI(Agentic AI)의 구현을 위한 도구 호출 능력을 대폭 강화한 것이 특징이다.

특히 고성능 인프라 없이 엔비디아 A100 수준의 범용 GPU(그래픽처리장치)에서도 원활하게 구동되도록 최적화해 중소기업과 학계 연구자들도 비용 부담없이 AI를 활용할 수 있도록 실용성을 높였다.

'카나나-2' 효율성의 핵심은 ‘전문가 혼합(MoE,)’ 아키텍처다. 전체 파라미터는 32B(320억 개) 규모로 거대 모델의 높은 지능을 유지하면서도, 실제 추론 시에는 상황에 맞는 3B(30억 개)의 파라미터만 활성화해 연산 효율을 높였다.

또 MoE 모델의 학습에 필수적인 여러 커널을 직접 개발해 성능 손실 없이 학습 속도는 높이고, 메모리 사용량은 획기적으로 낮추는 성과를 거두기도 했다.


이러한 아키텍처 및 데이터의 고도화 뿐 아니라 데이터 학습 단계도 고도화했다. 사전 학습과 사후 학습 사이에 ‘미드 트레이닝(Mid-training)' 단계를 신설하고, AI 모델이 새로운 정보를 배울 때 기존 지식을 잊는 치명적 망각 현상을 방지하기 위해 ‘리플레이(Replay)’ 기법을 도입했다. 이를 통해 새로운 추론 능력을 추가하면서도 기존 한국어 구사와 일반 상식 능력을 안정적으로 유지할 수 있다.

김병학 카카오 카나나 성과리더는 "새로워진 카나나-2는 ‘어떻게 하면 고가의 인프라 없이도 실용적인 에이전트 AI를 구현할 수 있을까’에 대해 치열하게 고민한 결과"라며 "보편적인 인프라 환경에서도 고효율을 내는 모델을 오픈소스로 공개함으로써, 국내 AI 연구 개발 생태계 발전과 기업들의 AI 도입의 새로운 대안이 될 수 있기를 기대한다"고 밝혔다.

향후 카카오는 글로벌 최상위 수준의 성능을 목표로 하는 파운데이션 모델 개발을 이어가고, 더욱 복잡한 에이전트 시나리오에도 대응할 수 있는 고도화된 AI를 선보인다는 계획이다.


wongood@fnnews.com 주원규 기자

Copyrightⓒ 파이낸셜뉴스. 무단전재 및 재배포 금지.

info icon이 기사의 카테고리는 언론사의 분류를 따릅니다.

AI 이슈 트렌드

실시간
  1. 1이민정 이병헌 션 리차드
    이민정 이병헌 션 리차드
  2. 2그린란드 지정학적 갈등
    그린란드 지정학적 갈등
  3. 3아시안컵 한일전 패배
    아시안컵 한일전 패배
  4. 4이재명 가짜뉴스 개탄
    이재명 가짜뉴스 개탄
  5. 5김하성 부상 김도영
    김하성 부상 김도영

파이낸셜뉴스 하이라이트

파워링크

광고
링크등록

당신만의 뉴스 Pick

쇼핑 핫아이템

AD