컨텐츠로 건너뛰기
뉴스
서울
맑음 / -1.4 °
메트로신문사 언론사 이미지

KT AI '믿:음 2.0', 한국어 LLM 성능 평가서 국내 1위 차지

메트로신문사 김서현
원문보기

KT가 자체 개발한 '믿:음 2.0'이 한국어 LLM(초거대언어모델) 성능 평가 플랫폼 '호랑이(Horangi) 리더보드'에서 국내 1위를 차지했다.

KT는 지난 4일 공개한 KT의 자체 개발 모델 '믿:음 2.0 베이스'가 한국어 LLM 평가 지표 '호랑이 리더보드3'에서 파라미터 수 150억개 미만의 국내 기업 개발 모델 가운데 종합 성능 1위를 기록했다고 9일 밝혔다.

믿:음 2.0 베이스의 종합 점수는 0.7197다. 세부적으로는 범용 성능 0.7004, 응답 정렬 성능 0.739로 평가됐다. 전세계 동급 모델 중에서는 3위에 해당하는 수준이다.

호랑이 리더보드는 글로벌 MLOps(머신러닝작업) 기업 웨이트앤바이어스(W&B)가 주관하는 한국어 특화 LLM 평가 벤치마크다. 실제 한국어 환경에서의 범용적인 언어 이해력과 응답 안전성을 포함하는 정렬성 등 한국어 LLM의 실용적인 역량을 다면적으로 평가한다.

단편적인 지식을 묻는 질문에 대한 답변 정확성을 평가하는 기존 벤치마크와 달리, 작문·추론·정보 추출 등 실생활 시나리오를 기반으로 평가하여 모델의 실용적 능력을 평가하는 지표로 주목받고 있다.

믿:음 2.0은 외산 모델을 기반으로 단순 튜닝하는 방식이 아닌, 아키텍처 설계부터 데이터 구축, 학습까지 전 과정을 KT가 직접 수행하는 '프롬 스크래치' 방식으로 개발한 순수 자체 개발 모델이라는 점에서도 기술적 의미가 크다.


KT 생성형 AI 랩장(CAIO) 신동훈 상무는 "믿:음 2.0을 국내 다양한 산업 분야에 적용해 '한국적 AI'의 시장 확산에 본격적으로 나설 것"이라며 "한국적 AI의 실용화와 기술 발전을 이끄는 핵심 주체로 자리매김하겠다"고 말했다.

한편 KT는 믿:음 2.0 기반의 맞춤형 B2B AI 솔루션을 산업 전반에 제공하고, 공공·금융·교육·법률 분야에서 실증을 추진한다. 현재 공개된 버전에서 성능을 더 높인 믿:음 2.0 프로 공개도 준비하고 있다. 이어 믿:음 2.0의 추론, 멀티모달 기능 확장과 함께 국산 AI 반도체 기업 리벨리온과의 협력을 통한 AI 생태계 강화 등도 계획 중이다.

info icon이 기사의 카테고리는 언론사의 분류를 따릅니다.

AI 이슈 트렌드

실시간
  1. 1라건아 더비
    라건아 더비
  2. 2식스센스2 미미
    식스센스2 미미
  3. 3안세영 최고 승률
    안세영 최고 승률
  4. 4내란재판부 위헌
    내란재판부 위헌
  5. 5조지호 파면
    조지호 파면

메트로신문사 하이라이트

파워링크

광고
링크등록

당신만의 뉴스 Pick

쇼핑 핫아이템

AD