컨텐츠로 건너뛰기
뉴스
서울
맑음 / -3.9 °
디지털데일리 언론사 이미지

[IT클로즈업] SKT A.X K1, 압도적 규모 눈길…과제는 ‘경량화·비용’

디지털데일리 오병훈 기자
원문보기

[디지털데일리 오병훈기자] 독자 인공지능(AI) 파운데이션 모델 프로젝트의 다음 생존자는 누가 될까. 이달 중 5개 정예팀 중 첫 탈락 팀이 발표된다. 지난달 30일 열린 1차 발표회에서 선보인 5개 정예팀 독자 AI 모델들을 두고 전문가들의 평가가 진행될 예정이며 살아남은 4개 정예팀은 더 치열한 경쟁을 이어갈 예정이다.

5개 정예팀 중 유일한 통신사 주관사 SK텔레콤 컨소시엄의 생존여부에 관심이 집중된다. KT도 컨소시엄을 꾸려 경쟁에 참가했지만 5개 정예팀에 들지 못했다. LG유플러스는 LG AI 연구원 컨소시엄의 참여기업으로 경쟁을 이어가고 있다.

통신사 경우 대규모 통신 데이터와 정보기술(ICT) 역량을 지니고 있어 경쟁에서 유리한 위치에 서 있다는 것이 전문가 분석이다. 특히 SK텔레콤 자체적으로도 통화 에이전트 AI ‘에이닷(A.)’ 서비스 운영 경험을 보유하고 있다. SK텔레콤 또한 스스로 이같은 강점을 알고 있다. 그 결과 5개 팀중 파라미터(매개변수) 규모가 가장 큰 모델을 선보였다.

다만 전문가들은 현재 시점에서 AI 모델의 파라미터 규모가 크다고 무조건 좋은 것은 아니라고 평가한다. 결과적으로 중요한 것은 이 모델을 중심으로 얼마나 효율적으로 특화 모델을 생성할 수 있는지가 핵심이라는 분석이다.

◆500B 매개변수…MoE까지 “다 준비했다” 자신감

SK텔레콤 컨소시엄이 선보인 K-AI 모델 A.X K1 특징 중 눈길을 끄는 것은 단연 파라미터 규모다. A.X K1의 매개변수는 5000억개(500B)로 5개 팀중 가장 거대한 규모를 자랑한다.

나머지 4개 정예팀의 매개변수 크기와 비교하면 압도적인 크기다. LG AI 연구원의 ‘K-엑사원’이 2360억개, 네이버클라우드의 ‘HCX 시드 8B 옴니’과 ‘HCX 시드 32B 싱크’가 각각 80억개와 320억개다. NC AI의 ‘배키’와 업스테이지 ‘솔라 오픈’은 동일하게 1000억개다.


500억개 매개변수라는 수치는 국내에서 개발된 AI 중 가장 거대한 규모라는 점에서 의미가 있다. 매개변수는 AI 모델 성능을 가장 단편적으로 가늠해볼 수 있는 수치다. 매개변수가 많을 수록 더 많은 데이터를 학습하고 연산할 수 있다는 것을 의미한다.

SK텔레콤도 발표 당시 A.X K1이 여타 모델보다 압도적으로 많은 매개변수를 지니고 있다는 점을 최대 강점으로 내세웠다. 국가 대표 ‘파운데이션’ 모델을 만드는 사업인 만큼 기초 모델로서 그에 걸맞는 규모로 준비했다는 전략이다.

정석근 SK텔레콤 AI CIC장은 지난 30일 1차 발표회에서 “현재 1조 파라미터(1000B) 규모 모델을 보유한 국가는 미국이 유일하다”며 “500B 이상 모델 역시 중국을 비롯해서 최근 프랑스와 일본 정도가 겨우 합류했을 정도로 진입 장벽이 매우 높다”고 강조했다.


실제 글로벌 시장에서 활용도가 가장 높은 ‘챗GPT’나 ‘제미나이’ 등 모델의 파라미터도 모두 1조개가 넘는다.

전문가 혼합(MoE)을 통한 효율적인 운용도 SK텔레콤이 내세운 강점이다. MoE는 전체 매개변수 중 이용자 명령에 부합하는 매개변수만 활성화해 연산하는 시스템을 의미한다. 모든 연산 때마다 5000억개 파라미터가 동원 될 경우 답변 속도가 느려질 수 있으며 그 과정에서 발생하는 막대한 비용이 문제될 수 있다. 이를 해결하기 위해 나온 기술이 MoE 아키텍처다.

정 CIC 장은 발표회에서 “잘 만든 모델 하나가 우리 사회의 고속도로나 공항 같은 핵심적인 디지털 사회 간접 자본이 되는 것”이라며 “A.X K1을 활용해서 실용적인 다양한 모델을 개발한다면 높은 성능과 효율성 두 마리 토끼를 모두 잡을 수 있을 것”이라고 강조했다.


◆500B 감당 가능할까…특화모델 알고리즘·지속 가능성 과제

업계 전문가들도 SK텔레콤 컨소시엄이 선보인 A.X K1 모델의 매개변수가 지닌 강점에 주목했다. 문서작성이나 이미지 생성 등 단순 작업은 적은 매개변수 모델로도 가능하지만 제조 산업 등에서 요구 되는 설계·공정 등 전문적인 영역에서는 거대한 매개변수가 필수적이라는 설명이다.

AI 업계 전문가는 “매개변수가 큰 모델을 시도했다는 점에서는 긍정적”이라며 “정부에서 요구하는 것은 궁극적으로 제조 산업에 적용할 수 있는 AI 파운데이션 모델이기 때문에 크기가 작은 모델로는 이를 충족하는데 한계가 있다”고 강조했다.

전문가들은 대규모 매개변수 모델이 안고 있는 과제를 해결하는 것이 중요하다고 봤다. A.X K1은 파운데이션 모델로 각 산업 분야에 실제로 적용하기 위해서는 경량화 작업을 통한 특화모델 생성이 필수적이다. 거대한 매개변수를 그대로 사용할 경우 비용·시간 측면에서 효율이 떨어지기 때문이다.

그 과정에서 A.X K1 매개변수가 큰 만큼 특화모델을 생성하는 경량화 작업에도 상당한 비용과 시간이 소모될 수 있다는 것이 전문가 분석이다. 경량화 작업은 단순히 데이터 크기를 줄이는 것이 아니라 필요한 부분과 필요 없는 부분을 구분하고, 경량화 된 모델을 기반으로 데이터를 재학습하는 과정을 거쳐야 한다. 매개변수가 거대할 수록 더 많은 GPU 인프라를 오랫동안 가동해 이를 수행해야 한다.

업계 전문가는 “거대 매개변수 모델을 지속적으로 운용하고 경량화하는 비용을 SK텔레콤 컨소시엄이 감당할 수 있을지가 관건”이라며 “중장기적인 관점에서 거대 규모 모델을 효율적으로 운용할 수 있는 방법론에 대한 연구가 필수적”이라고 평가했다.

- Copyright ⓒ 디지털데일리. 무단전재 및 재배포 금지 -

info icon이 기사의 카테고리는 언론사의 분류를 따릅니다.

AI 이슈 트렌드

실시간
  1. 1한일 협력
    한일 협력
  2. 2최진혁 아기
    최진혁 아기
  3. 3박재범 아이돌 롱샷
    박재범 아이돌 롱샷
  4. 4서울 시내버스 파업
    서울 시내버스 파업
  5. 5법원행정처장 박영재 대법관
    법원행정처장 박영재 대법관

디지털데일리 하이라이트

파워링크

광고
링크등록

당신만의 뉴스 Pick

쇼핑 핫아이템

AD