컨텐츠로 건너뛰기
뉴스
서울
맑음 / -3.9 °
국제뉴스 언론사 이미지

UNIST 윤성환 교수팀, 데이터 증강 통한 강건성 향상 조건 수학적 증명

국제뉴스
원문보기
[주영곤 기자]
(사진제공=UNIST) [연구진사진] 윤성환 교수(좌측)와 유위범 연구원(제1저자, 우측)

(사진제공=UNIST) [연구진사진] 윤성환 교수(좌측)와 유위범 연구원(제1저자, 우측)


(울산=국제뉴스) 주영곤 기자 = 눈보라에도 차선을 이탈하지 않는 자율주행차, 저화질 사진으로도 암을 진단하는 의료 AI 등을 만들기 위해서 AI 모델의 '강건성'이 뛰어나야 한다. 데이터 증강은 이러한 강건성을 높이는 기법으로 널리 쓰여왔는데, 그 정확한 강건성 향상 조건을 국내 연구진이 수학적으로 증명했다.

수학적 검증만으로도 효과적인 증강 기법을 선별할 수 있게 돼 AI 모델 개발의 생산성을 크게 높일 수 있을 전망이다.

UNIST 인공지능대학원 윤성환 교수팀은 AI 학습의 필수 단계인 데이터 증강이 모델의 강건성을 높이는 조건을 수학적으로 증명했다고 19일 밝혔다.

딥러닝 모델은 학습한 데이터와 조금만 다른 환경에 노출되면 성능이 급격히 저하되는 약점이 있다. 원본 데이터에 인위적으로 변형을 가해 학습량을 늘리는 데이터 증강이 필수적인 이유다. 하지만 어떤 변형 방식이 가장 효과적인지에 대해서는 명확히 밝혀진 바가 없다 보니, 수많은 시행착오를 반복해야만 했다.

이번 연구에 따르면, 근접 지지 증강(PSA, Proximal-Support Augmentation)이라는 조건을 만족하는 증강일수록 원하는 효과를 거둘 수 있다. PSA는 원본 데이터에 미세한 변형을 가해 원본 데이터 주변을 촘촘히 채우는 증강 방식이다.

연구팀은 먼저 데이터 공간과 파라미터 공간에서 변화가 서로 대응된다는 점을 증명한 뒤, PSA 조건을 만족하는 데이터 공간에서의 변화가 파라미터 공간의 손실함수 지형도 평평하게 다져준다는 사실을 입증함으로써 이 같은 사실을 밝혀냈다.


즉, 입력 데이터 주변을 촘촘히 채우면, 이에 대응하는 모델 내부의 파라미터 공간도 평평해져 AI가 강건성을 갖추게 되는 것이다. 모델 손실함수의 지형이 평탄(Flat Minima)할 경우, 뾰족한 지형(Sharp Minima)에 비해 강건성이 높다.

또 실제 실험에서도 PSA 조건을 충족한 데이터 증강 기법이 그렇지 않은 기법보다 월등한 강건성을 보였다.

연구팀은 "데이터 증강 설계를 보다 체계적인 과학으로 만든 연구"라며, "자율주행, 의료 영상, 제조 검사처럼 분포가 자주 바뀌는 실제 환경에서 신뢰할 수 있는 AI 모델을 만드는 데 중요한 이론적 기반이 될 것"이라고 밝혔다.


이번 연구는 세계적 인공지능 학술대회 중 하나인 전미인공지능학회(AAAI, Association for the Advancement of Artificial Intelligence) 2026 정식 논문으로 채택됐다. 올해 학회는 오는 20일부터 27일까지 싱가포르에서 열린다.

연구는 과학기술정보통신부와 정보통신기획평가원(IITP)의 '지역지능화혁신인재양성 사업(울산과학기술원)', '인공지능대학원(울산과학기술원)' 사업, 'AI스타펠로우십(울산과학기술원)' 사업, '인간지향적차세대 도전형 AI기술 개발' 사업 그리고 한국연구재단 지원 개인기초연구 중견연구를 통해 수행됐다.

(논문명: A Flat Minima Perspective on Understanding Augmentations and Model Robustness)


※ 붙임: 연구결과개요, 용어설명, 그림설명

■ 연구 결과 개요

1. 연구배경

최근 인공지능 모델은 이미지·음성·텍스트 등 다양한 데이터를 활용해 복잡한 환경에서도 안정적으로 동작해야 한다는 요구를 받고 있다. 이를 위해 데이터 증강(data augmentation) 기법이 널리 사용되고 있지만, 어떤 증강이 언제 실제로 "강인성(robustness)"을 높여주는지에 대한 이론적 이해는 부족했다.

지금까지는 증강 기법을 여러 가지 조합해보고, 많은 실험을 반복해 본 뒤에야 해당 방법이 일반화 성능과 분포 이동(distribution shift) 상황에서 얼마나 효과적인지 확인할 수 있었다. 이 과정은 시간과 비용이 많이 들고, 모델 구조나 데이터가 바뀔 때마다 다시 처음부터 검증해야 한다는 한계를 갖고 있었다.

2. 연구내용

이번 연구는 "데이터 증강이 모델의 강인성을 언제, 왜 향상시키는가?"라는 질문에 대해, 평탄한 최소점(flat minima) 관점에서 이론적 해답을 제시한 연구이다.

먼저, 입력 근방 안정성과 파라미터 근방 평탄성과의 쌍대성은 다음과 같이 성립됨을 보인다. 특정 데이터 주변의 작은 변형(노이즈, 회전, 밝기 변화 등)에 대해서도 예측이 안정적으로 유지되면, 그에 상응하는 파라미터 공간에서도 작은 변화에 손실이 거의 변하지 않는 "평탄한 최소점"에 도달하게 된다는 것을 이론적으로 정식화 했다. 이를 통해 입력공간에서의 견고함이 곧 파라미터 공간에서의 평탄함으로 이어진다는 연결 고리를 제시했다.

다음으로, PSA(Proximal-Support Augmentation) 조건을 제시했다. 연구진은 데이터 증강이 강인성 향상에 기여하기 위한 핵심 조건으로 PSA 조건을 정의했다. PSA 조건이란, 각 학습 데이터 주변의 작은 반경안에 증강 데이터가 충분히 조밀하게 존재하는 증강 방식을 의미한다. 즉, 원본과 너무 동떨어진 극단적 변형보다는, 원본 데이터 근처를 촘촘하게 채워 주는 증강이 평탄한 최소점 형성에 결정적인 역할을 한다는 것을 이론적으로 증명했다.

마지막으로, 평탄한 최소점과 분포 이동 아래 강인성을 연결시켰다. PSA 조건을 만족하는 증강 하에서 학습을 진행하면, 파라미터 공간에서 손실이 낮게 유지되는 영역의 반경이 커지는, 더 평탄한 최소점에 도달하게 된다. 연구진은 이러한 평탄성이 있을 때, 학습 분포와 다른 환경(잡음 추가, 화질 저하, 센서 특성 변화 등)에

서의 목표 위험(target risk) 상한이 줄어든다는 일반화 이론을 제시했다. 이로써 "PSA를 만족하는 증강을 사용하면, 분포가 달라져도 성능이 잘 유지되는 강인한 모델을 얻을 수 있다"는 것을 수학적으로 보여주었다.

3. 기대효과

본 연구는 데이터 증강과 모델 강인성의 관계를 하나의 이론적 틀로 설명했다는 점에서 의미가 크다. PSA 조건은 비교적 단순한 기준으로, 어떤 증강 기법이 강인성 향상에 얼마나 기여할지 사전에 가늠할 수 있게 되었다. 이는 차세대 증강 기법 설계에 가이드라인을 제공하는 효과를 지닌다. 새로운 증강 기법을 제안할 때, PSA 조건을 얼마나 잘 만족시키는지 확인함으로써, 실제 대규모 실험에 앞서 성공 가능성을 빠르게 진단하고 시행착오를 줄일수 있다. 또한, 다양한 모델과 분야에 폭넓게 활용 가능하다는 이점이 있다. 제안된 이론은 특정 네트워크 구조나 데이터셋에 의존하지 않기 때문에, 이미지에 국한되지 않고 음성 및 텍스트등 다양한 도메인으로 확장 가능하다. 의료 영상, 자율 주행, 제조 분야와 같이 분포가 자주 바뀌고 노이즈가 많은 환경에서 특히 활용 가치가 큰 것으로 예상된다. 궁극적으로는 적은 데이터와 자원으로 신뢰할 수 있는 AI 시스템을 설계하고 검증하는 데 기여할 것으로 예상된다.

■ 용 어 설 명

증강(Data Augmentation)

기존 학습 데이터를 회전, 자르기, 색상 변화 등 다양한 방식으로 변형해 데이터 양을 늘리고 모델의 일반화 성능을 높이는 기법.

-최소점(Flat Minima)

손실 함수(loss function)을 파라미터 공간에서 바라볼 EO, 주변의 작은 변화에도 손실 값이 크게 변하지 않는 넓고 완만한 영역의 최소점. 이런 지점에 도달한 모델은 새로운 데이터나 환경 변화에 상대적으로 성능이 잘 유지되는 것으로 알려져 있다.

-강인성(Model Robustness)

입력 데이터에 노이즈, 왜곡, 악의적 교란이 추가되거나, 학습 때와 다른 분포의 데이터가 들어 왔을때도 성능이 크게 떨어지지 않는 모델의 특성.

(PSA, Proximal-Support Augmentation)

학습 샘플 주변의 작은 거리안에, 증강 샘플이 충분히 조밀하게 분포하는 조건. PSA 조건을 잘 만족할수록 평탄한 최소점으로 수렴하기 쉬워지고, 분포 이동 상황에서의 강인성이 향상되는 것으로 나타났다.

-이동(Distribution Shift)

학습에 사용된 데이터 분포와 실제 서비스 환경에서 들어오는 데이터 분포가 달라지는 현상. 예시로, 밝기가 다른 카메라, 잡음이 많은 마이크, 새로운 날씨 등이 있다.

■ 그 림 설 명

[연구그림] PSA 증강이 평탄한 최소점을 형성하는 과정

[연구그림] PSA 증강이 평탄한 최소점을 형성하는 과정


그림 1. PSA 증강이 평탄한 최소점을 형성하는 과정의 개념도

원본 이미지 주변에 다양한 증강 이미지를 배치한 입력 공간과, 그에 상응하는 파라미터 공간의 손실 지형을 함께 나타낸 그림(좌단). 원본 근처를 조밀하게 채우는 증강인 근접지지증강을 적용했을 때, 파라미터 공간에서 넓고 완만한 평탄한 최소점이 형성되는 모습을 도식화했다. (중앙) PSA 증강을 통한 입력 안정성 확보와 손실 지형 평탄화 효과 (우단)

민영뉴스통신사 국제뉴스/news0024@naver.com

<저작권자 Copyright ⓒ 국제뉴스 무단전재 및 재배포 금지>

info icon이 기사의 카테고리는 언론사의 분류를 따릅니다.

AI 이슈 트렌드

실시간
  1. 1김형석 독립기념관장 해임
    김형석 독립기념관장 해임
  2. 2김병기 탈당
    김병기 탈당
  3. 3음주운전 논란 임성근
    음주운전 논란 임성근
  4. 4이혜훈 청문회 자료 제출
    이혜훈 청문회 자료 제출
  5. 5김하성 송성문 WBC 불참
    김하성 송성문 WBC 불참

국제뉴스 하이라이트

파워링크

광고
링크등록

당신만의 뉴스 Pick

쇼핑 핫아이템

AD