컨텐츠로 건너뛰기
뉴스
서울
맑음 / -3.9 °
파이낸셜뉴스 언론사 이미지

AI 학습 데이터 자연어로 변환...AI 블랙박스 해독

파이낸셜뉴스 연지안
원문보기
대형언어모델(LLM)을 활용한 데이터 설명문 생성 및 선별·학습 과정 개요. UNIST 제공

대형언어모델(LLM)을 활용한 데이터 설명문 생성 및 선별·학습 과정 개요. UNIST 제공


[파이낸셜뉴스] 울산과학기술원(UNIST) 인공지능대학원 김태환 교수팀은 인공지능(AI) 학습 데이터를 인간이 이해할 수 있는 ‘자연어’로 변환함으로써 AI 블랙박스를 설명하는 학습 방법론을 제안했다고 28일 밝혔다.

기존의 설명 가능한 인공지능(XAI) 연구는 주로 학습이 완료된 모델의 내부 연산 과정이나 예측 결과를 사후적으로 분석하는 데 집중했다. 반면 연구팀은 AI 학습의 원천인 ‘데이터’에 주목해 데이터의 특징을 설명문으로 구체화하고 이를 분석함으로써 모델의 의사결정 과정을 규명하고자 했다.

연구팀은 먼저 챗GPT와 같은 LLM 모델로 사진 속 사물의 특징을 여러 문장으로 설명하게 했다. 환각 현상 없는 고품질 설명문을 만들기 위해서는 인터넷 백과사전과 같은 외부 지식도 참고하도록 했다.

연구팀은 이렇게 영향력이 큰 설명문들이 실제 모델이 정답을 맞추는 성능에도 도움이 되는지를 확인하기 위해 별도의 벤치마크 실험을 설계했다. 영향력이 높은 설명문을 모델 학습에 함께 제공하고 새로운 데이터셋에서 분류 작업을 수행하는, 교차 모달 전이 실험을 진행한 것이다.

그 결과, 영향력이 높은 설명문을 사용했을 때 기존 방식보다 안정적으로 높은 성능을 보였다. 이는 모델이 학습 과정에서 실제로 활용했던 설명이 성능에도 의미 있는 기여를 한다는 사실을 보여주는 검증 결과다.

김태환 교수는 “연구에서 제시한 AI가 스스로 자신이 학습하는 데이터를 설명하는 방식은 딥러닝의 복잡한 의사결정 과정을 본질적으로 드러내는 방법이 될 수 있다”며 “향후 블랙박스 AI 시스템을 투명하게 이해하는 기반이 될 것이다”라고 말했다.


연구 결과는 자연어처리(NLP) 분야 대표 국제학회인 EMNLP(Empirical Methods in Natural Language Processing)의 정식 논문으로 채택됐다. 올해 EMNLP는 11월 5일부터 9일까지 중국 쑤저우에서 열렸다.

jiany@fnnews.com 연지안 기자

Copyrightⓒ 파이낸셜뉴스. 무단전재 및 재배포 금지.

info icon이 기사의 카테고리는 언론사의 분류를 따릅니다.

AI 이슈 트렌드

실시간
  1. 1강민호 FA 계약
    강민호 FA 계약
  2. 2통일교 특검법
    통일교 특검법
  3. 3프로보노 정경호
    프로보노 정경호
  4. 4김범석 쿠팡 불출석
    김범석 쿠팡 불출석
  5. 5이제호 파주 프런티어
    이제호 파주 프런티어

파이낸셜뉴스 하이라이트

파워링크

광고
링크등록

당신만의 뉴스 Pick

쇼핑 핫아이템

AD