컨텐츠로 건너뛰기
뉴스
서울
맑음 / -3.9 °
머니투데이 언론사 이미지

AI가 구겨진 영수증도 분류…네이버클라우드 '도큐먼트 OCR' 출시

머니투데이 백지수기자
원문보기
[머니투데이 백지수 기자]

클로바 도큐먼트 OCR(CLOVA Document OCR)가 사업자등록증을 읽은 결과 예시 /사진=네이버클라우드

클로바 도큐먼트 OCR(CLOVA Document OCR)가 사업자등록증을 읽은 결과 예시 /사진=네이버클라우드



네이버클라우드는 네이버의 인공지능(AI) 클로바(CLOVA)가 업무 문서의 글자를 읽고 항목별 분류를 돕도록 개발한 '클로바 도큐먼트 OCR(CLOVA Document OCR)'의 업무용 특화 모델을 출시했다고 11일 밝혔다.

클로바 도큐먼트 OCR(광학문자인식) 특화 모델은 자연어처리기술(NLP)을 기반으로 비정형의 여러 문서들을 선행 학습한 클로바 AI가 업무 문서에서 사업자 번호, 상호, 지점명 등 주요 정보를 나타내는 글자만 추출해 문서 분류를 돕는 솔루션이다.

영수증, 신용카드, 사업자등록증, 명함, 신분증, 의료비 지출 내역 등 문서 양식이나 글자 위치가 달라도 문서 속 주요 정보만 추출하고 항목별 분류까지 가능하다는 설명이다.

그동안에는 문서 발급 기관이 서로 달라 문서 형태가 기존 학습 데이터와 상이하거나 주민등록증이나 운전면허증, 여권처럼 빛 반사가 많고 워터마크나 형광인쇄 등 위·변조 기술이 적용된 문서 등에는 OCR 기술이 까다로웠다.

하지만 클로바 도큐먼트 OCR은 인식한 문서에서 정보의 연결 관계까지 파악해 텍스트와 숫자 값이 의미하는 바를 정확하게 찾아낼 수 있다고 네이버클라우드는 소개했다. 구겨지거나 오염된 서류, 명함처럼 디자인이 가미된 문서에서도 텍스트를 추출해 낼 수 있다는 설명이다. 네이버는 이 기술을 네이버웍스와 리멤버 서비스에서도 활용하고 있다고 밝혔다. 오는 5월 의료비 영수증 인식 서비스도 업데이트하겠다고도 밝혔다.


네이버클라우드는 다만 신용카드나 주민등록증 등 민감정보와 개인정보를 인식하기 위해 클로바 도큐먼트 OCR을 사용하려는 기업은 사전 신청 절차를 거쳐 선별적으로 승인해 사용하도록 하겠다고 밝혔다. 이들 기업에는 OCR을 안전하게 사용하기 위한 보안 아키텍처도 별도로 안내된다.

한상영 네이버클라우드 상무는 "산업군을 막론하고 자동화를 통해 업무를 간소화하는 추세가 이어지면서 OCR의 활용 분야가 다각화되고 비즈니스 현장의 핵심 기술로 자리매김하고 있다"며 "향후 Document OCR 특화 모델을 지속적으로 확장하고 네이버 클라우드 플랫폼의 다른 서비스와 유기적으로 연계한 솔루션을 출시해 네이버클라우드 만이 제공할 수 있는 차별화된 서비스로 혁신을 선도해 나가겠다"고 말했다.

백지수 기자 100jsb@mt.co.kr

<저작권자 ⓒ '돈이 보이는 리얼타임 뉴스' 머니투데이, 무단전재 및 재배포 금지>

info icon이 기사의 카테고리는 언론사의 분류를 따릅니다.

AI 이슈 트렌드

실시간
  1. 1박원숙 컨디션 난조
    박원숙 컨디션 난조
  2. 2윤정수 원진서 결혼
    윤정수 원진서 결혼
  3. 3통일교 특검 수사
    통일교 특검 수사
  4. 4박지훈 정관장 삼성 승리
    박지훈 정관장 삼성 승리
  5. 5김장훈 미르 신부 얼굴 노출 사과
    김장훈 미르 신부 얼굴 노출 사과

머니투데이 하이라이트

파워링크

광고
링크등록

당신만의 뉴스 Pick

쇼핑 핫아이템

AD