컨텐츠로 건너뛰기
뉴스
서울
맑음 / -3.9 °
아이뉴스24 언론사 이미지

사진 보여주니 "서울의 청계천이 배경"⋯카카오, 고성능 경량 AI 모델 공개

아이뉴스24 정유림
원문보기
"이미지로 표현된 한국어와 영어 문서 이해 능력 뛰어나⋯오픈AI GPT-4o와 견줄 정도"
특정 작업에 최적화된 일부 전문가 모델만 활성화하는 방식의 MoE 구조 모델도 공개
자체 모델 개발 역량·서비스 운영 경험 바탕으로 '독자 AI 파운데이션 모델' 프로젝트 참여
[아이뉴스24 정유림 기자] 카카오는 이미지 정보 이해·지시 이행 능력을 갖춘 경량 멀티모달 언어모델과 MoE(전문가 혼합) 모델을 오픈소스로 공개했다고 24일 밝혔다.

이미지 정보 이해·지시 이행 능력을 갖춘 카카오의 경량 멀티모달 언어모델(카나나-1.5-v-3b)에 사진을 제시하고 답변을 얻은 결과물 예시 [사진=카카오]

이미지 정보 이해·지시 이행 능력을 갖춘 카카오의 경량 멀티모달 언어모델(카나나-1.5-v-3b)에 사진을 제시하고 답변을 얻은 결과물 예시 [사진=카카오]



카카오에 따르면 텍스트(글) 뿐만 아니라 이미지 정보도 처리할 수 있는 경량 모델(카나나-1.5-v-3b)은 이용자의 질문 의도를 정확히 이해하는 지시 이행 성능과 높은 한국어·영어 이미지 이해 능력을 보유한 것이 특징이다.

카카오 관계자는 "경량 모델은 한국어 벤치마크에서 유사 규모의 국내외 공개 모델과 비교한 결과 최고 점수를 기록했고 다양한 영어 벤치마크에서 해외 오픈소스 공개 모델과 비교했을 때도 유사한 수준의 성능을 보였다"며 "이미지로 표현된 한국어와 영어 문서 이해 능력은 오픈AI의 GPT-포오(4o)와 견줄 수 있을 정도로 뛰어나다"고 강조했다. 또한 "지시 이행 능력 벤치마크에서는 국내 공개된 유사한 규모의 멀티모달 언어모델 대비 128% 수준의 성능을 기록했다"고 설명했다.

이미지 정보 이해·지시 이행 능력을 갖춘 카카오의 경량 멀티모달 언어모델(카나나-1.5-v-3b)과 국내외 모델 성능 비교 표 [사진=카카오]

이미지 정보 이해·지시 이행 능력을 갖춘 카카오의 경량 멀티모달 언어모델(카나나-1.5-v-3b)과 국내외 모델 성능 비교 표 [사진=카카오]



강점을 토대로 이미지·글자 인식, 동화·시 창작, 국내 문화유산과 관광지 인식, 도표 이해, 수학 문제 풀이 등 여러 분야에서 활용할 수 있다. 예를 들어 장소 사진과 함께 "이 사진이 촬영된 장소에 대해 간단히 설명해줘"라고 질문하면 "이 사진은 서울 청계천을 배경으로 하고 있습니다"와 같이 국내 지역에 대한 높은 인식력을 바탕으로 정확한 답변을 제공한다는 것이 회사 측 설명이다. 이미지 검색, 콘텐츠 분류 등 실시간성과 효율성이 요구되는 분야에서도 효과적인 사용이 기대된다.

카카오는 모델의 성능에 집중하는 단계를 넘어 AI가 사람처럼 생각하고 행동할 수 있는 멀티모달 이해 능력, 이용자 지시 수행 능력, 추론 능력을 갖추도록 발전시키는 데 주력하고 있다. 하반기 중에는 '에이전트형 AI' 구현에 필수적인 추론 모델의 성과도 공개할 방침이다.

아울러 일반적인 밀집(Dense) 모델과 차별화되는 MoE 구조의 언어모델도 공개했다. MoE는 입력 데이터 처리 시 모든 매개변수(파라미터)가 연산에 참여하는 기존 모델과 달리 특정 작업에 최적화된 일부 전문가 모델만 활성화되는 방식으로, 효율적인 컴퓨팅 자원 활용과 비용 절감이 강점이다. 카카오에 따르면 MoE 구조를 적용한 모델(카나나-1.5-15.7b-a3b)은 전체 157억개의 매개변수 중 추론 시 약 30억개의 매개변수만 활성화돼 동작한다.


카카오는 MoE 모델이 고성능 AI 인프라를 저비용으로 구축하고자 하는 기업이나 연구 개발자에게 실용적인 도움을 제공할 수 있을 것으로 보고 있다. 특히 추론 과정에서 제한된 매개변수만 사용하는 구조적 특성으로 저비용, 고효율 서비스 구현에 유리해 활용도가 높은 것이 특징으로 꼽힌다.

정부가 추진하는 독자 AI 파운데이션 모델 프로젝트에 참여한 카카오는 이러한 자체 모델 개발 역량, 카카오톡으로 대표되는 대규모 서비스 운영 경험 등을 토대로 전 국민의 AI 접근성을 높이고 국가 AI 경쟁력을 강화하는데 기여한다는 방침이다.

김병학 카카오 카나나 성과리더는 "이번 모델 공개는 비용 효율성과 성능이라는 유의미한 기술 개발의 성과를 거둔 것으로, 단순한 모델 구조의 진보를 넘어 서비스 적용과 기술 자립이라는 2가지 측면의 목표에 부합하는 결과물"이라며 "자체 기술 기반의 모델을 꾸준히 고도화하며 국내 AI 생태계의 자립성과 기술 경쟁력 강화에 기여할 것"이라고 밝혔다.

/정유림 기자(2yclever@inews24.com)


[ⓒ 아이뉴스24 무단전재 및 재배포 금지]

info icon이 기사의 카테고리는 언론사의 분류를 따릅니다.

AI 이슈 트렌드

실시간
  1. 1청와대 복귀
    청와대 복귀
  2. 2이시영 캠핑장 민폐
    이시영 캠핑장 민폐
  3. 3뉴진스 다니엘 연탄 봉사
    뉴진스 다니엘 연탄 봉사
  4. 4대만 포위 훈련
    대만 포위 훈련
  5. 5두산 카메론 영입
    두산 카메론 영입

아이뉴스24 하이라이트

파워링크

광고
링크등록

당신만의 뉴스 Pick

쇼핑 핫아이템

AD