컨텐츠로 건너뛰기
뉴스
서울
구름많음 / 6.3 °
MBN 언론사 이미지

KT, 한국 특화 요소 담은 '믿:음 2.0' 오픈소스 공개

MBN
원문보기

KT 기술혁신부문 연구원들이 서초구 KT 우면연구센터에서 믿:음 2.0을 테스트하고 있다. 출처=KT


KT가 언어모델(LLM) '믿:음 2.0'의 오픈소스를 기업과 개인, 공공이 활용할 수 있도록 AI 개발자 플랫폼 허깅페이스(HuggingFace)를 통해 공개할 예정이라고 3일 밝혔습니다.

110억 파라미터 이상의 한국어 범용 LLM을 누구나 상업적으로 활용할 수 있는 오픈소스로 공개한 첫 사례입니다.

한국적 AI 철학을 담아 개발한 믿:음 2.0은 사회적 맥락과 같은 무형의 요소와 한국어 고유의 언어적·문화적 특성을 반영했습니다

이번 모델은 115억 파라미터 규모의 ‘믿:음 2.0 베이스(Base)’와 23억 파라미터 규모의 ‘믿:음 2.0 미니(Mini)’ 2종류로 한국어와 영어를 지원합니다.

믿:음 2.0 Base는 범용 서비스에 적합한 모델로 한국 특화 지식과 문서 기반의 질의 응답에 적합하고, 믿:음 2.0 Mini는 Base 모델에서 증류한 지식을 학습한 소형 모델입니다.

믿:음 모델은 KT와 고려대학교가 공동 개발한 한국어 AI 역량 평가 지표인 ‘Ko-Sovereign(코-소버린)’ 벤치마크에서 글로벌 최고 수준의 오픈소스 모델을 능가하는 점수를 기록했습니다.


KT는 국내 교육용 도서와 문학 작품 등의 발간물, 법률 및 특허 문서, 각종 사전 등 방대한 한국 특화 데이터를 학습에 활용했고, 저작권 이슈가 있는 데이터는 모두 제거해 고품질 데이터를 선별했습니다.

또, AI의 윤리성 및 신뢰성을 높이기 위해 국내외 정책과 가이드라인을 기반으로 전문가들과 함께 만든 ‘AI 영향 평가 체계’를 적용했습니다.

KT는 마이크로소프트와의 협업으로 GPT-4에 한국적 사고를 추가 학습시키는 방식의 모델도 공개할 예정입니다.


신동훈 KT Gen AI Lab장(CAIO)은 "KT가 국내 사용자들에게 고성능 한국적 AI 모델에 대한 새로운 대안을 제시하는 한편 글로벌 경쟁력을 갖추게 될 중요한 발판이 될 것"이라고 말했습니다.

정예린 기자 jeong.yelin@mbn.co.kr

< Copyright ⓒ MBN(www.mbn.co.kr)무단전재 및 재배포 금지 >

info icon이 기사의 카테고리는 언론사의 분류를 따릅니다.

AI 이슈 트렌드

실시간
  1. 1손흥민 토트넘 복귀
    손흥민 토트넘 복귀
  2. 2박나래 갑질 논란
    박나래 갑질 논란
  3. 3린가드 심판 판정 개선
    린가드 심판 판정 개선
  4. 4BNK 김소니아 안혜지
    BNK 김소니아 안혜지
  5. 5가스공사 역전승
    가스공사 역전승

MBN 하이라이트

파워링크

광고
링크등록

당신만의 뉴스 Pick

쇼핑 핫아이템

AD