컨텐츠로 건너뛰기
뉴스
서울
맑음 / -3.9 °
쿠키뉴스 언론사 이미지

'MoE 구조 악용하면 제미나이 유해응답 최대 80%↑'… KAIST, LLM 보안 취약성 세계 최초 규명

쿠키뉴스 이재형
원문보기
오픈소스 전문가 모델 악용, 전체 AI 안전성 훼손 가능
AI 성능 저하 없이 위험 응답 유도, 탐지 어려워
구글 제미나이 등 상용 LLM 구조 전반 취약성 확인
정보보안 최고 권위 ACSAC서 최우수논문상 수상
전문가 혼합 구조를 악용해 거대언어모델의 안전성을 훼손하는 것을 나타낸 이미지. KAIST

전문가 혼합 구조를 악용해 거대언어모델의 안전성을 훼손하는 것을 나타낸 이미지. KAIST



KAIST가 구글 제미나이 등 상용 거대언어모델(LLM)에 널리 쓰이는 전문가 혼합(MoE) 구조가 단 하나의 악성 전문가 모델만으로도 전체 인공지능(AI)의 안전성을 무너뜨릴 수 있음을 세계 최초로 규명했다.

KAIST는 전기및전자공학부 신승원 교수, 전산학부 손수엘 교수 공동연구팀이 전문가 혼합 구조를 악용해 거대언어모델의 안전성을 심각하게 훼손할 수 있는 공격 기법을 연구한 논문이 국제학회 ‘ACSAC 2025’에서 최우수논문상을 수상했다고 26일 밝혔다.

ACSAC는 정보보안 분야에서 가장 영향력 있는 국제 학술대회로, 올해 전체 논문 가운데 단 2편만 최우수논문으로 선정됐다.

연구팀은 전문가 혼합 구조의 근본적인 보안 취약성을 체계적으로 분석했다.

특히 공격자가 상용 거대언어모델의 내부 구조에 직접 접근하지 않더라도 악의적으로 조작된 ‘전문가 모델’ 하나만 오픈소스로 유통될 경우, 이를 활용한 전체 거대언어모델이 위험한 응답을 생성하도록 유도될 수 있음을 입증했다.

이는 정상적인 AI 전문가들 사이에 단 하나의 ‘악성 전문가’만 섞여 있어도 특정 상황에서 그 전문가가 반복적으로 선택되며 전체 AI의 안전성이 무너질 수 있다는 것이다.


이 과정에서 모델의 성능 저하는 거의 나타나지 않아 문제를 사전에 발견하기 어렵다는 점이 특히 위험한 요소로 지적됐다.

실험결과 연구팀이 제안한 공격 기법은 유해 응답 발생률을 기존 0%에서 최대 80%까지 증가시킬 수 있었고, 다수 전문가 중 하나만 감염돼도 전체 모델의 안전성이 크게 저하됨을 확인했다.

연구팀이 제안한 공격 기술 개념도. KAIST

연구팀이 제안한 공격 기술 개념도. KAIST



이번 연구는 세계로 확산 중인 오픈소스 기반 거대언어모델 개발 환경에서 발생할 수 있는 새로운 보안 위협을 최초로 제시했다는 점에서 큰 의미를 갖는다.


아울러 AI 모델 개발 과정에서 성능뿐 아니라 ‘전문가 모델의 출처와 안전성 검증’이 필수적임을 시사한다.

신 교수는 “효율성을 위해 빠르게 확산 중인 전문가 혼합 구조가 새로운 보안 위협이 될 수 있음을 이번 연구를 통해 실증적으로 확인했다”며 “이번 수상은 인공지능 보안의 중요성을 국제적으로 인정받은 의미 있는 성과”라고 말했다.

한편, 이번 연구는 KAIST 전기및전자공학부 김재한·송민규 박사과정, 나승호 박사 (현 삼성전자), KAIST 전기및전자공학부 신승원 교수, KAIST 전산학부 손수엘 교수가 참여했고, 연구결과는 지난 12월 미국 하와이에서 열린 ACSAC에서 발표됐다.
(논문명: MoEvil: Poisoning Experts to Compromise the Safety of Mixture-of-Experts LLMs, 논문 파일: https://jaehanwork.github.io/files/moevil.pdf, GitHub(기술 오픈소스): https://github.com/jaehanwork/MoEvil)

(왼쪽부터)KAIST 송민규 박사과정, 김재한 박사과정, 손수엘 교수 (우측상단) 신승원 교수, 나승호 책임연구원. KAIST

(왼쪽부터)KAIST 송민규 박사과정, 김재한 박사과정, 손수엘 교수 (우측상단) 신승원 교수, 나승호 책임연구원. KAIST


info icon이 기사의 카테고리는 언론사의 분류를 따릅니다.

AI 이슈 트렌드

실시간
  1. 1수원FC 단장 사임
    수원FC 단장 사임
  2. 2아마추어 야구 지원
    아마추어 야구 지원
  3. 3김영대 평론가 사망
    김영대 평론가 사망
  4. 4이정규 광주 파이널A
    이정규 광주 파이널A
  5. 5돈봉투 상고
    돈봉투 상고

쿠키뉴스 하이라이트

파워링크

광고
링크등록

당신만의 뉴스 Pick

쇼핑 핫아이템

AD