카카오가 20일 자체 기술로 개발한 차세대 언어모델 '카나나(Kanana)-2'를 업데이트하고, 총 4종의 신규 모델을 오픈소스로 공개했다. 지난해 12월 첫 공개 이후 한 달여 만에 이뤄진 대규모 성능 개선으로, 고성능과 효율성을 동시에 끌어올렸다는 평가다.
이번에 공개된 카나나-2 모델은 엔비디아 A100 수준의 범용 GPU 환경에서도 원활하게 구동되도록 최적화했다. 최신 초고가 인프라에 대한 의존도를 낮춰 중소기업과 학계 연구자도 비용 부담 없이 고성능 AI를 활용할 수 있도록 실용성을 강화했다는 점이 특징이다.
핵심 기술은 전문가 혼합 방식(MoE) 아키텍처다. 전체 파라미터 규모는 320억 개이지만, 실제 추론 과정에서는 30억 개만 활성화해 연산 효율을 크게 높였다. 카카오는 MoE 학습에 필요한 커널을 직접 개발해 성능 저하 없이 학습 속도를 높이고 메모리 사용량을 줄였다.
학습 구조 역시 고도화했다. 사전 학습과 사후 학습 사이에 미드 트레이닝 단계를 새로 도입하고, 기존 지식을 잊는 치명적 망각 현상을 방지하기 위해 리플레이 기법을 적용했다. 이를 통해 새로운 추론 능력을 추가하면서도 한국어 성능과 일반 상식 이해도를 안정적으로 유지했다.
카카오는 기본 모델을 포함해 지시 이행 모델, 추론 특화 모델, 미드 트레이닝 모델 등 총 4종을 허깅페이스에 공개했다. 연구 활용도가 높은 미드 트레이닝 탐색용 모델을 함께 제공해 오픈소스 생태계 기여도도 높였다.
카나나-2는 단순 대화형을 넘어 실질적인 업무 수행이 가능한 에이전트 AI 구현에 초점을 맞췄다. 멀티턴 도구 호출 데이터를 집중 학습해 복잡한 지시를 이해하고 적절한 도구를 선택·호출하는 능력을 강화했다. 내부 평가에서 동급 모델 대비 지시 이행 정확도와 도구 호출 성능, 한국어 이해력에서 우위를 보였다.
카카오의 김병학 카나나성과리더는 "카나나-2는 고가의 인프라 없이도 실용적인 에이전트 AI를 구현할 수 있는지에 대한 고민의 결과"라며 "보편적인 환경에서도 고효율을 내는 모델을 오픈소스로 공개해 국내 AI 연구와 기업들의 AI 도입에 실질적인 대안이 되기를 기대한다"고 말했다.































































