컨텐츠로 건너뛰기
뉴스
서울
맑음 / -3.9 °
헤럴드경제 언론사 이미지

카카오, ‘카나나-2’ 모델 4종 추가 공개

헤럴드경제 고재우
원문보기
효율 혁신·학습 세분화…에이전틱 AI 목표
범용 GPU서 원활 구동, 모델 실용성 강화
경기도 성남시 카카오 판교 아지트. [카카오 제공]

경기도 성남시 카카오 판교 아지트. [카카오 제공]



[헤럴드경제=고재우 기자] 카카오는 자체 기술력을 기반으로 개발한 차세대 언어모델 ‘카나나-2(Kanana-2)’를 업데이트하고, 4종의 모델을 오픈소스로 추가 공개했다고 20일 밝혔다.

카나나-2는 지난해 12월 허깅페이스를 통해 오픈소스로 공개한 언어모델이다. 에이전틱(Agentic AI) 구현을 목표로 한 카카오는 약 한달만에 4종의 모델을 추가로 내놨다.

세부적으로 4종의 모델은 고효율과 저비용의 성능 혁신은 물론, 실질적인 에이전틱 AI 구현을 위한 도구 호출 능력이 강화됐다. 특히 최신 초고가 인프라가 아닌 엔비디아 A100 수준의 범용 그래픽 처리 장치(GPU)에서도 원활하게 구동되도록 최적화됐다는 게 카카오 설명이다. 이를 통해 중소기업과 학계 연구자들도 비용 부담 없이 고성능 AI를 활용할 수 있게 됐다.

이와 함께 카나나-2는 ‘전문가 혼합(MoE)’ 아키텍처를 기반으로 하고 있다. 전체 파라미터는 32B(320억개) 규모로 거대 모델의 높은 지능을 유지하면서도, 실제 추론 시에는 상황에 맞는 3B(30억개)의 파라미터만 활성화하도록 설계됐다.

MoE 모델의 학습에 필수적인 여러 커널을 개발해 학습 속도는 높이고, 메모리 사용량은 획기적으로 낮추기도 했다.

데이터 학습 단계도 고도화됐다. 사전 학습과 사후 학습 사이에 ‘미드 트레이닝’ 단계가 신설됐다. 인공지능(AI) 모델이 새로운 정보를 배울 때 기존 지식을 잊는 현상을 방지하기 위해 ‘리플레이’ 기법도 도입됐다. 이를 통해 새로운 추론 능력을 추가하면서도 기존 한국어 구사와 일반 상식 능력을 안정적으로 유지할 수 있다.


이를 바탕으로 카카오는 ▷기본 모델 ▷지시 이행 모델 ▷추론 특화 모델 ▷미드 트레이닝 모델 등 총 4종의 모델을 허깅페이스에 추가로 공개했다.

아울러 카나나-2 모델은 단순 대화형 AI를 넘어 실질적인 업무 수행이 가능한 에이전트 AI 구현을 지향한다. 멀티턴 도구 호출 데이터를 학습시켜 지시 이행과 도구 호출 능력을 강화했다. 이를 통해 복잡한 사용자 지시를 이해하고, 적절한 도구를 스스로 선택 및 호출할 수 있도록 했다.

실제 성능 평가에서 동급 경쟁 모델인 ‘큐웬-30B-A3B-Instruct-2507’ 대비 ▷지시 이행 정확도 ▷멀티턴 도구 호출 성능 ▷한국어 능력 등에서 우위를 기록했다.


김병학 카카오 카나나 성과 리더는 “새로워진 카나나-2는 실용적인 에이전트 AI 구현을 고민한 결과”라며 “보편적인 인프라 환경에서도 고효율을 내는 모델을 공개함으로써, 국내 AI 연구 개발 생태계 발전과 기업들의 AI 도입에 새로운 대안이 될 수 있기를 기대한다”고 밝혔다.

한편 카카오는 현재 MoE 구조를 기반으로 수천억 파라미터 모델 ‘카나나-2-155b-a17b’의 개발을 위한 학습을 진행 중이다.

info icon이 기사의 카테고리는 언론사의 분류를 따릅니다.

AI 이슈 트렌드

실시간
  1. 1음주운전 임성근
    음주운전 임성근
  2. 2트럼프 관세 압박
    트럼프 관세 압박
  3. 3이재명 대통령 국정 운영
    이재명 대통령 국정 운영
  4. 4이혜훈 청문회
    이혜훈 청문회
  5. 5신용해 구속영장 반려
    신용해 구속영장 반려

헤럴드경제 하이라이트

파워링크

광고
링크등록

당신만의 뉴스 Pick

쇼핑 핫아이템

AD