컨텐츠로 건너뛰기
뉴스
서울
맑음 / -1.6 °
머니투데이 언론사 이미지

개인정보 걱정없는 가상 데이터로 AI 학습

머니투데이 김성휘기자
원문보기
댓글 이동 버튼0
김현태 그레타 공동대표
시뮬레이션·알고리즘 통해 만든 합성데이터, 신뢰·안전↑
금융·헬스케어등에 활용, 2030년 글로벌 시장 3조원 전망

그레타 기업 개요/그래픽=김지영

그레타 기업 개요/그래픽=김지영


'수도권에 사는 A씨 vs 경기 수원시 40대 남성 자영업자 홍길동씨.'

2가지 정보 중 어느 쪽이 데이터로서 가치가 높을지는 분명하다. 더 구체적인 후자다. 하지만 '홍길동'이라는 실제 인물의 정보를 무작정 사용할 수는 없다. 이름, 주소 등은 중요한 개인정보고 질병이력 등 의료정보라면 극히 민감한 프라이버시 사안이다. 데이터 생성·분석이 AI(인공지능) 시대의 핵심분야로 떠올랐지만 데이터산업이 빨리 성장하기 어려운 배경에 이같은 한계가 있다. 이를 극복하는 대안이 합성데이터다. 합성데이터는 시뮬레이션이나 알고리즘을 통해 만들어낸 가상의 데이터다. 새로 창조하는 생성형, 실제 데이터와 흡사한 구조를 갖도록 만든 재현형으로 나눌 수 있는데 '그레타'는 특히 재현형 데이터에 강점이 있는 스타트업이다.

김현태 대표(사진)는 최근 머니투데이 스타트업 미디어 플랫폼 '유니콘팩토리'와 만나 "합성데이터는 실제와 비슷하게 신뢰도가 높고 개인정보 우려에서 안전하다"며 "금융, 헬스케어 등에 활용하면 AI모델을 개발하거나 성능을 향상하는데 시간과 비용을 획기적으로 개선할 것"이라고 말했다.

그레타는 2021년 연세대 응용통계학과 동료 교수 사이인 김현태·임종호 공동대표가 창업했다. 두 사람의 전공인 데이터와 통계 전문기술이 연구실을 넘어 실생활과 산업에 쓰이길 바랐다. 그레타는 한국인터넷진흥원(KISA) 스타트업대회 수상, NICE 오픈이노베이션 선정 등 기술력을 인정받았다. 올해 중소벤처기업부 창업도약패키지의 대기업 협업프로그램에 선발돼 이와 연계한 교보생명의 오픈이노베이션 '든든프로그램' 지원을 받는다.

자율주행차든, 가정용 휴머노이드든 미리 데이터로 할 일을 학습해야 제 역할을 한다. 처음엔 실제 데이터를 일일이 수작업으로 수집·가공했다. 자율주행의 경우 도로사진에서 자동차를 구분, 표시한 후 '이것이 자동차'라는 이름표(라벨)를 붙여 AI모델에 반복해서 알려줬다. 데이터에 라벨을 붙인다는 데이터 라벨링 과정이다. 합성데이터 기술은 사람이 할 때 시간·비용이 많이 드는 데이터 라벨링을 효과적으로 대체할 수 있다. 잘 만들어진 합성데이터는 실제 데이터를 썼을 때와 비슷하게 AI모델의 학습효과를 낸다.

그레타는 현재 합성데이터 솔루션 '신테그라', 가상의 인물(페르소나)을 설정할 수 있는 '신페르소나'를 핵심 서비스로 제공한다. 신테그라는 의료분야 임상기관이 사용 중이다. 일정기간이 지나면 파기해야 하는 원데이터와 달리 이를 기반으로 합성데이터를 만들면 이후 비슷한 임상이나 연구·개발에 계속 쓸 수 있다.


금융업계는 예전부터 여러 명의 가상고객, 즉 '페르소나'를 설정해 상품이나 서비스 적합도를 평가했다. 합성데이터를 쓰면 수만, 수십만 명에 해당하는 페르소나를 활용할 수 있다. 김 대표는 "그레타는 AI, DL(딥러닝·첨단기술)을 이용한 데이터 기반 서비스를 제공한다"며 "특히 정형(실제 데이터를 모방) 합성데이터 기술력은 국내 최고로 글로벌 기준에도 뒤처지지 않는다"고 말했다.

그레타는 기업과 주식시장 정보를 바탕으로 기업가치를 분석할 수 있는 '엘도'를 개발, 세 번째 핵심 비즈니스모델로 키운다는 목표다. 내년 1월 'CES(국제가전박람회) 2026'에 참가, 상용모델 출시를 앞둔 '엘도' 기술을 글로벌 고객 앞에서 시연한다. 김 대표는 "일부 투자사로부터 관심과 투자의향을 확인했다"고 말했다.

한편 글로벌 시장조사기관 가트너는 2030년 세계 합성데이터 생성시장을 약 22억2616만달러(약 3조2800억원) 규모로 전망했다.

김성휘 기자 sunnykim@mt.co.kr

Copyright ⓒ 머니투데이 & mt.co.kr. 무단 전재 및 재배포, AI학습 이용 금지.

info icon이 기사의 카테고리는 언론사의 분류를 따릅니다.

AI 이슈 트렌드

실시간
  1. 1마체고라 대사 사망
    마체고라 대사 사망
  2. 2김은중 감독 책임
    김은중 감독 책임
  3. 3박소희 하나은행 5연승
    박소희 하나은행 5연승
  4. 4프로농구 현대모비스
    프로농구 현대모비스
  5. 5조진웅 이선균 옹호 논란
    조진웅 이선균 옹호 논란

머니투데이 하이라이트

파워링크

광고
링크등록

당신만의 뉴스 Pick

쇼핑 핫아이템

AD