컨텐츠로 건너뛰기
뉴스
서울
맑음 / -3.9 °
플래텀 언론사 이미지

한국딥러닝, VLM 기반 OCR 솔루션 'DEEP OCR+' 론칭

플래텀 플래텀
원문보기

공공·기업용 시각지능 AI 통합 솔루션 기업 한국딥러닝이 VLM 기반 OCR 솔루션인 'DEEP OCR+'을 출시했다.

DEEP OCR+은 기존 광학문자인식(OCR)의 기능을 넘어, 문서의 의미와 구조를 자동으로 분석하고 핵심 정보를 추출할 수 있도록 설계됐다. 한국딥러닝이 지난 5년간 4억 장 이상의 텍스트·이미지 문서를 학습한 VLM(Vision-Language Model) 모델을 기반으로 개발됐다. 별도의 데이터 수집이나 라벨링 없이도 다양한 문서 유형을 즉시 처리할 수 있어 초기 도입 부담이 거의 없다. 최소한의 고객 데이터만으로도 최적의 정확도를 보장한다.

기존 OCR 솔루션은 문서 이미지에서 텍스트를 추출하는 데 중점을 뒀다. 하지만 표, 조항, 문단 등 복잡한 문서 구조를 인식하는 데는 제약이 있었다. 특히 계약서나 청구서처럼 포맷이 일정하지 않은 문서의 경우, 문서마다 별도 설계와 라벨링이 필요해 도입 및 유지 비용이 높았다.

DEEP OCR+는 특정 포맷에 의존하지 않고도 문서의 전체 구조와 의미를 이해할 수 있어 비정형화된 문서도 즉시 처리 가능하다. 이미지와 텍스트를 동시에 처리할 수 있는 VLM 기술을 바탕으로, 사용자가 문서를 업로드하면 별도 학습 없이도 주요 정보를 구조화된 형태로 정리해준다. 일례로 계약서를 입력하면 날짜, 금액, 주요 조항 등을 추출하고, 리스크가 될 수 있는 항목을 요약해 표시하는 식이다. 이를 통해 문서 검토 및 입력에 소요되는 시간을 줄일 수 있으며, 다양한 양식의 문서를 별도 커스터마이징 없이 처리할 수 있기 때문에 업무 자동화에 실질적인 기여가 가능하다.

구축형 외에도 SaaS 및 API 형태로도 제공된다. 고객사는 자사 환경에 맞게 유연하게 도입할 수 있으며, 평균 도입 기간은 2주 내외다. 기존 OCR 솔루션의 경우 수억 원 규모의 프로젝트와 수개월의 개발 기간이 필요했던 것과 비교하면, 비용과 시간 측면에서의 진입 장벽을 낮췄다.

다국어가 혼합된 문서나, 정형화되지 않은 양식에도 대응할 수 있다. 한국어, 영어, 숫자, 특수문자가 혼합된 문서나 복잡한 표·문단 구조를 포함한 문서도 문제없이 처리 가능하며, 출력 포맷 역시 JSON, Excel 등 다양한 형태로 지원돼 RPA나 ERP 시스템과의 연동도 수월하다.

한국딥러닝 김지현 대표는 “DEEP OCR+은 금융, 법률, 공공 등 다양한 분야에서 도입 가능성이 검토되고 있으며, 일부 대형 프로젝트에서는 이미 시범 적용이 진행 중이다”며, “최근 단순한 인식 기술을 넘어 문서 내 의미와 맥락까지 파악할 수 있는 AI 기술에 대한 관심이 함께 높아지고 있다. 이번 신제품은 이러한 흐름 속에서 문서 처리 기술의 진화를 보여주는 사례가 될 것”이라고 설명했다.


글 : 플래텀(editor@platum.kr)
ⓒ '스타트업 전문 미디어 & 중화권 전문 네트워크' 플래텀, 조건부 전재 및 재배포 허용

info icon이 기사의 카테고리는 언론사의 분류를 따릅니다.

AI 이슈 트렌드

실시간
  1. 1통일교 신천지 특검
    통일교 신천지 특검
  2. 2우수의정대상 수상
    우수의정대상 수상
  3. 3젤렌스키 트럼프 회담
    젤렌스키 트럼프 회담
  4. 4김영대 추모
    김영대 추모
  5. 5오타니 WBC 출전
    오타니 WBC 출전

플래텀 하이라이트

파워링크

광고
링크등록

당신만의 뉴스 Pick

쇼핑 핫아이템

AD