컨텐츠로 건너뛰기
뉴스
서울
맑음 / -3.9 °
뉴시스 언론사 이미지

"의료 데이터 용량 부족 문제 해결"…'AI 압축기술' 개발

뉴시스 류난영
원문보기
서울성모·고대안암, 데이터 관리비용 절감 AI 기술
중요도 낮으면 고도압축·높으면 고배율…용량 90%↓
31개 암·13개 병리 AI 과제서 성능, 기존방식 넘어서
[서울=뉴시스] 아다슬라이드 연구 개요와 프로세스 및 성능 결과. A는 훈련시키는 데 사용된 31개 암종 PanCancer 데이터셋 구성. B는 이미지 처리과정: 타일링-CDA-인코딩-디코딩-재구성. C는 13개의 병리 진단 작업에서 원본 대비 성능을 시각화한 스파이더 웹 차트. (사진= 서울성모병원 제공)

[서울=뉴시스] 아다슬라이드 연구 개요와 프로세스 및 성능 결과. A는 훈련시키는 데 사용된 31개 암종 PanCancer 데이터셋 구성. B는 이미지 처리과정: 타일링-CDA-인코딩-디코딩-재구성. C는 13개의 병리 진단 작업에서 원본 대비 성능을 시각화한 스파이더 웹 차트. (사진= 서울성모병원 제공)


[서울=뉴시스] 류난영 기자 = 다기관 국제 연구팀이 최근 디지털 병리 이미지의 진단 정확도를 유지하면서도 데이터 용량을 현저히 줄일 수 있는 새로운 적응형(Adaptive) 압축 프레임워크 개발에 성공했다.

22일 의료계에 따르면 이성학 가톨릭대학교 서울성모병원 병리과 교수·안상정 고려대학교 안암병원 병리과 교수 공동 연구팀(제1저자 이종현 펜실베니아대학교 생물통계학과 박사)은 디지털 병리 진단이 확대됨에 따라 동반되는 만성적인 저장공간 문제 해결을 위해 '아다슬라이드'(AdaSlide) 기술을 개발했다.

최근 이미지 스캔 기반의 디지털 병리 진단 시스템이 임상 전반에 확대되면서 발생한 데이터의 보관과 처리가 중요한 화두로 떠오르고 있다. 기존에는 슬라이드를 실물로 보관하기 위한 공간과 환경 문제가 이슈였다면, 이제는 병리 진단을 위해 요구되는 고해상도 이미지 데이터 관리가 병원의 큰 부담으로 떠오르고 있다.

디지털 병리 시스템을 도입한 병원에서는 환자 한 명당 약 3~4기가바이트(GB), 매년 수백 테라바이트(TB)의 데이터를 보관하기 위해 막대한 저장공간이 필요한 것으로 알려졌다. 또 단순히 보관만 하는 것이 아니라 때로는 보관된 이미지를 재판독하는 경우도 있는 만큼, 판독 품질에 영향을 최소화하면서도 효율적으로 용량을 감소시키는 압축 기술에 대한 필요성이 제기돼 왔다.

그러나 이제까지 연구됐던 다양한 압축 방식들은 슬라이드를 전체를 일괄적으로 처리하는 과정에서 필수적인 세포 정보를 훼손하거나, 혹은 불필요한 배경 데이터까지 고화질로 저장하는 비효율성이 있었다. 연구팀은 이를 해결하고자 전체 슬라이드를 압축 처리하는 것이 아니라, 인공지능을 활용해 한 슬라이드 내에서도 단위 영역별로 다르게 처리하는 하이브리드 압축 플랫폼 아다슬라이드(AdaSlide)를 개발했다.

예를 들어 암세포가 밀집해 정밀한 진단이 필요한 영역은 원본 화질을 보존하고, 지방 조직이나 빈 배경처럼 진단적 중요도가 낮은 영역은 고배율로 압축하는 방식으로 학습된 인공지능(AI)으로 이미지를 자동 처리하는 방식이다. 병리 이미지 내에서 진단적 가치가 높은 영역과 그렇지 않은 영역 간의 '정보 불균형'을 적절히 처리한다면 중요한 진단 부위의 이미지 품질저하를 최소화하면서도 용량 효율화를 이룰 수 있다는 것이다.


31개 암종을 포함한 '판캔서'(PanCancer) 데이터셋의 약 180만 개 패널 이미지를 활용해 학습된 '압축 결정 에이전트'(Compression Decision Agent)는 이미지 내의 각 영역을 분석해 압축 여부를 스스로 판단하며, 압축된 이미지는 이후 '기초 이미지 복원기'를 통해 분석 가능한 수준으로 복원이 가능하다.

13개의 다양한 병리 진단 과제(분류 및 분할)를 통해 성능을 검증한 결과, 해당 기술은 원본 이미지 대비 저장 용량을 65%에서 최대 90%까지 줄이면서도 진단 성능은 원본과 동등한 수준을 유지하는 것으로 나타났다. 특히 기존의 균일 압축 방식이 세포 경계를 불분명하게 만들어 분석을 어렵게 했던 것과 달리 연구팀의 플랫폼은 정보 손실을 최소화해 정밀한 분석을 가능케 했다.

이를 검증하기 위해 병리 전문의 5명이 참여한 시각적 튜링 테스트(Visual Turing Test)에서는 원본 이미지와 아다슬라이드로 복원된 이미지를 구별해낸 비율은 56%에 그쳤을 뿐 아니라 통계적으로 유의하지 않았다. 이는 숙련된 전문의도 육안으로 차이를 느끼기 어려운 수준의 품질을 시사한 결과다.


또 인공지능 비교판독 시뮬레이션 결과, 핵 분할 데이터셋(SNOW, PanNuke), 분류작업(NCT-CRC, MHIST, LI, SICAPv2) 등에서 아다슬라이드 결과물이 원본 대비 향상된 분석 성능을 제공하기도 했다. 이는 이미지 처리 과정에서 발생한 정보 이득 에 따른 것으로, 이미지 복원 과정에서 불필요한 노이즈가 감소하고 색상이 정규화되며 중요한 정보 위주로 데이터가 보존된 결과라는 설명이다.

무엇보다 이번 연구는 단순한 용량 압축을 넘어, 인공지능이 진단에 필요한 정보를 스스로 선별하고 보존한다는 점에서 의미가 있는 것으로 평가된다. 연구팀은 아다슬라이드를 개발하며, 병리 전문의가 실제 진단 시 집중하는 영역과 유사한 패턴으로 데이터를 처리하도록 구현했다.

중요도가 떨어지는 배경 영역은 과감히 압축하고, 진단 핵심 영역은 보존하는 방식으로 진단 품질 훼손을 최소화하면서도 한정된 스토리지 자원으로도 더 많은 환자의 데이터를 장기간 보관할 수 있게 돼 향후 AI 의료 빅데이터 구축의 효율성을 크게 높일 것으로 기대된다.


이번 연구를 주도한 이성학 서울성모병원 교수는 "진단적으로 중요한 정보가 무엇인지를 인공지능이 스스로 판단하고 선택적으로 보존하는 기술은 의료 데이터의 의미 기반 관리라는 새로운 방향성을 제시하는 접근"이라며 "향후 대규모 병리 AI 학습 데이터 구축과 국제 공동연구 환경에서도 실질적인 효율성을 제공할 수 있을 것"이라고 말했다.

공동 교신저자인 안상정 고려대학교 의과대학 교수는 "디지털 병리의 확산에 있어 가장 큰 걸림돌 중 하나인 데이터 저장 비용 문제를 진단 정확도 저하 없이 해결할 수 있는 기술적 토대를 마련했다"며 "향후 이 기술이 병원의 의료 데이터 관리 효율을 높이는데 일조하겠다"고 전했다.

이번 연구 성과는 저명한 국제 학술지 '네이처 커뮤니케이션즈'(Nature Communications)에 게재됐다.

☞공감언론 뉴시스 you@newsis.com

▶ 네이버에서 뉴시스 구독하기
▶ K-Artprice, 유명 미술작품 가격 공개

info icon이 기사의 카테고리는 언론사의 분류를 따릅니다.

AI 이슈 트렌드

실시간
  1. 1차은우 200억 탈세 의혹
    차은우 200억 탈세 의혹
  2. 2쿠팡 ISDS 중재
    쿠팡 ISDS 중재
  3. 3평화위원회 출범
    평화위원회 출범
  4. 4박철우 우리카드 삼성화재
    박철우 우리카드 삼성화재
  5. 5이수혁 팬미팅 해명
    이수혁 팬미팅 해명

뉴시스 하이라이트

파워링크

광고
링크등록

당신만의 뉴스 Pick

쇼핑 핫아이템

AD