1세대 개발자 출신 부모님 영향, 10대 때부터 개발 접해…22세에 한국딥러닝 창업 시도
구조화된 문서 인식하는 OCR 넘어 문서 자체를 이해·데이터화하는 ‘딥 에이전트’ 선보여
엔비디아 등 글로벌 빅테크와 전략적 파트너십, 함께 시각 AI 개발 및 고도화 진행
공공과 민간을 막론한 모든 조직의 업무는 문서에서 시작된다. 그러나 각 기업과 기관에서 다뤄지는 문서의 구조와 유형은 셀 수 없을 정도로 다양하다. 이른바 비정형 데이터다. 여기에서 필요한 정보를 추출해 유의미하게 활용하기 위해서는 정형화된 데이터로 가공이 필수적이다.
이 과정에서 데이터 추출에 쓰이는 기술이 바로 OCR(Optical Character Recognition, 광학문자인식)이다. 그런데 문제가 있었다. 기존 OCR 시스템은 실제 적용 전 대량의 데이터 학습 과정이 필요하고, 문맥에 따라 정확한 데이터 추출에 한계가 있다는 점이다. 또 문서 자료의 상태에 따라 오류가 발생할 가능성도 높았다.
ⓒTech42 |
2019년 설립된 ‘한국딥러닝’은 시각지능(Vision AI) 기술을 바탕으로 기존 OCT 기술의 문제를 해결하고, 더 나아가 문서 이해 중심의 딥러닝 솔루션을 제공하며 주목받고 있다. OCR 기술의 한계를 뛰어넘는 VLM(Vision-Language Model) 기반 문서 처리 솔루션 ‘딥 에이전트(DEEP Agent)’가 그것이다. 이는 사전학습 없이도 다양한 문서의 구조와 의미를 즉시 이해하는 모델로 주목 받았다. 게다가 한국딥러닝은 KT, 현대, 경기도, 국세청, 한국벤처투자 등 80개 이상 공공·기업 고객사를 확보하며 자체 매출로 성장을 이어가고 있다. 모두 단 6년이라는 기간 동안 이뤄낸 성과다.
이뿐 만이 아니다. 그 사이 한국딥러닝은 올해 상반기 기준 1억장 이상의 문서 학습 데이터셋과 13건의 관련 기술 특허를 확보했다. 이를 통해 기존 66일 걸리던 AI 도입 기간을 단 10일로 줄였다. 최근에는 ‘딥 에이전트’ 출시 2개월 만에 9억원의 수주 실적을 달성하며, 문서 자동화 시장의 판을 흔드는 다크호스로 떠올랐다.
ⓒTech42 |
더욱 흥미로운 사실은 이러한 혁신의 시작이 놀랍게도 6년 전 22세 대학생으로부터 시작됐다는 점이다. 김지현 한국딥러닝 대표는 1세대 개발자 출신 부모의 영향을 받아 10대 시절부터 코팅을 습득했다. 기술을 알게 되니 곧 다가올 변화는 자연스럽게 깨달았다.
딥러닝, AI 기술의 흐름을 단순한 유행이 아닌 메가트렌드로 인식한 김 대표는 대학 입학 직후부터 스타트업 현장에서 실무를 익히며 OCR 기술을 중심으로 한 사업 모델을 구상했다. 그 과정에서 김 대표는 “AI는 감성이 아닌, 수치로 ROI(투자대비수익률)가 입증돼야 성공할 수 있는 기술”이라는 확신을 얻었고, 이는 이른 나이에 창업을 실행하는 동력이 됐다.
이에 테크42는 김지현 한국딥러닝 대표를 만나 짧은 기간 놀라운 성과를 이뤄내고 있는 기술 성장 스토리와 앞으로 이뤄 나갈 목표에 대해 이야기를 들어봤다.
개발자 부모님 영향으로 일찌감치 기술에 눈 떠, “창업이 공부보다 좋았다”
“아카데믹한 것보다, 현실에서 어떻게 기술이 쓰일 수 있을지에 더 관심이 많았어요.”
김지현 대표는 스스로를 "이론을 파고드는 스타일은 아니었다"고 말한다. 그보다는 실질적인 문제 해결, 추상적 개념보다는 손에 잡히는 본질적인 결과물에 재미를 느끼는 성향이었다.
김 대표의 성향은 남다른 가정 환경도 적잖은 영향을 미친 듯했다. 김 대표의 부모는 국내 개발자 1세대 출신이었다. 덕분에 어릴 적부터 코볼(COBOL) 같은 개발언어를 다루는 모습을 봤다고. 기술과 소프트웨어에 관심은 그렇게 자연스럽게 생겨났다.
대학에 입학 할 무렵 전공은 당연하듯 소프트웨어를 선택했다. 이후 김 대표는 학업과 동시에 스타트업 현장에 발을 들였다. 학기 중에는 학교를 다니며 일을 병행했고 방학 중에도 AI 연구소와 기업에서 실무 경험을 쌓았다. 그 과정에서 당시 업계에 확산됐던 '딥러닝'이라는 기술이 단순한 유행이 아닌 거대한 흐름임을 직감했다.
ⓒTech42 |
“이건 한때 지나가는 기술이 아니라고 느꼈어요. 시장에 깊게 스며들 흐름이었고, 제가 창업할 타이밍도 지금밖에 없겠다는 확신이 들었습니다.”
창업을 결심한 순간부터 김 대표는 스스로에게 ‘과연 어떤 기술이 진짜 시장에서 사용될 수 있을까’라는 질문을 던졌다고 한다. 그런 김 대표의 눈에 들어온 기술이 인공지능, 그 중에서도 비전 AI다. 김 대표는 ‘사업성을 중요하게 따졌다’며 말을 이어갔다.
“창업을 하고 제품을 만들면 어쨌든 고객이 돈을 주고 살 것을 만들어야 한다고 생각했어요.인공지능이 아니라 뭐가 됐든 고객이 돈을 주고 사려면 그 만큼의 효용이 있어야 하는데, 단순히 그럴듯한 기술만으로는 예쁜 컵만도 못하다고 생각했어요. 예쁜 컵은 심적 효용이라도 있는데, 단지 기술만 가지고는 심적 효용 조차도 없죠. 기술 자체만 보면 몇 억을 투자할 수 있는 제품은 아니니까요. 그러면서 내가 현대차나 삼성전자 사장이라면 인공지능 중에서도 어떤 인공지능을 돈 주고 쓸 것인가를 고민했어요. 그게 저는 숫자, 즉 ROI가 계산 되는 인공지능이라고 봤어요.”
이런 판단 끝에 김 대표는 딥러닝 기반 OCR(광학문자인식)을 창업의 첫 비즈니스 아이템으로 선택했다. 당시만해도 OCR 기술은 글자를 인식하는 수준에 불과했다. 여기에 AI 기술을 적용해 단순 문자 추출을 넘어 문서의 의미를 이해할 수 있는 기술로 확장 가능하다는 판단이었다고. 게다가 실제 시장의 수요도 존재했다.
혼자 개발한 딥러닝 기반 OCR 기술, 우체국 운송장 분석부터 시작했다
ⓒTech42 |
창업 초기에 김 대표는 딥러닝 기반 OCR 엔진을 직접 개발해, 우편물 운송장 정보를 초고속으로 인식하는 모델을 만들었다. 이 모델은 우체국 프로젝트에 처음 도입됐다. 그렇게 올린 첫 매출이 약 300만원 정도다. 이것은 시작에 불과했다.
뒤이어 김 대표는 무인 신분증 인식 시스템 구축 사업에 도전했다. 무인으로 운영되는 코인노래방, PC방 등에서 신분증을 인식해 시간 대에 따라 미성년자의 출입을 제한하는 AI 기반 출입 통제 시스템이었다. 당시만 해도 이례적인 시도였다. 문제는 막 창업한 1인 기업으로써 하드웨어까지 개발할 예산이 없다는 것이었다.
하지만 궁하면 통한다고 했던가. 출입 통제 시스템 키오스크를 생산하는 하드웨어 업체가 김 대표의 기술에 관심을 보였고, 그렇게 김 대표가 개발한 소프트웨어가 탑재된 제품이 만들어졌다. 이 시스템은 소상공인시장진흥공단의 지원 사업에 채택되면서, 1억원 규모의 매출로 이어졌다. 학생 창업가의 기술로 만든 제품이 실전 무대에서 본격적인 성과를 입증한 순간이었다.
김 대표는 “개인 자금만으로는 어려운 프로젝트였는데, 키오스크 업체 대표님이 먼저 제안을 주셔서 함께 진행할 수 있었다”며 당시를 떠올렸다.
이후 한국딥러닝의 모토는 지속적인 기술 고도화였다고 해도 과언이 아니다. 단순 문자 추출에 머물렀던 OCR 기술에 딥러닝, 다시 AI를 더해 문서의 맥락과 구조까지 이해할 수 있는 매력적인 기술로 발전시켰고, 이와 함께 문서 이해형 VLM(Vision-Language Model) 모델 ‘프런티어’를 독자 개발해 ‘DEEP Agent’라는 고도화 솔루션으로 확장했다.
1억 장 이미지 데이터 학습, VLM 개발하기까지… “끊임없이 스노우볼 굴렸다”
한국딥러닝이 개발한 지능형 문서 처리 솔루션 ‘딥 에이전트(DEEP Agent)’는 ‘세상 모든 조직의 가장 일상적이고 보편적인 고통을 해결하겠다’는 목표 아래 개발됐다. 사전 학습 없이도 비정형 문서를 이해하고, 별도 템플릿 없이도 키-밸류 정보를 정확히 추출할 수 있는 이 기술의 기반에는 무려 1억장 규모의 학습 데이터셋이 있다.
하지만 이 방대한 데이터셋을 구축하기까지 과정은 쉽지 않았다고. 김 대표는 이를 ‘데이터 스노우 볼을 계속 굴려 크게 키우는데 집중했다”고 표현하며 말을 이어갔다.
“연구 목적으로 동의를 받은 데이터는 저희 협력사나 시장을 통해 많이 모으기도 했지만, 자체적으로 문서를 생성하는 데이터 업체 파이프라인을 통해서도 모았어요. 그 조차도 어려웠던 창업한 초기에는 직접 문서를 손으로 써서 데이터를 만들기도 했고요.”
그러한 노력은 창업 6년이 지난 현재까지도 지속되고 있다. 계약서, 세금계산서, 보험신청서 등 각종 문서 유형을 실제 고객 프로젝트를 통해 확보했고, 이를 기반으로 VLM(Vision-Language Model) 모델 ‘프런티어’ 고도화를 지속해 왔다. 그 결과 한국딥러닝의 ‘딥 에이전트’는 표, 필기체, 워터마크 등 복잡한 시각 요소가 포함된 문서도 99%라는 높은 정밀도로 인식하는 정확도를 달성했다. 속도 역시 1분에 780장을 처리하는 대량 문서 처리 성능을 자랑한다. 그간의 과정을 이야기하며 김 대표는 “지난 6년은 기술뿐 아니라 실력있는 팀을 만드는 과정이기도 했다”고 털어 놨다.
“창업 초기에는 정말 AI 전문가를 구하기 쉽지 않았어요. 특히 저희의 경우는 단순히 랩실에서 아카데믹한 작업만 해 오신 분들은 적응이 어려웠고, 실제 필드의 데이터와 환경을 접한 사람이 필요했어요. 단순히 코딩을 잘하는 것이 아니라 고객사가 어떤 문제를 고민하고 있는지, 어떤 환경인지를 파악해 어떤 기술을 구축해줘야 실제 효율적으로 쓸 수 있을지를 설계해주는 역량이 필요했죠. 쉽게 말하면 토익 점수는 보지 않지만 영어실력은 본다는 식이예요. 이력서 혹은 백그라운드의 커리어 레코드로 증명되는 분 말고 그런 것이 없어도 본질적으로 일을 해낼 수 있는 분들이 필요했죠. 그래서 저희가 초창기 선택한 방식이 오픈 리크루팅이예요.”
‘오픈 리크루팅은 사람을 찾기보다 프로젝트를 공개하고 관심 있는 개발자들이 깃허브, 슬랙 등을 통해 자연스럽게 접근하며 지원할 수 있도록 하는 방식이다. 당시 그렇게 지원해 온 초기 멤버들은 이제 한국딥러닝의 중요한 한 축을 담당하고 있다.
딥 에이전트로 바꿔가는 문서 자동화의 미래
산업 전반이 생성형 AI와 LLM 기반 서비스로 빠르게 재편되는 가운데, 최근 실사용 중심의 ‘에이전트(Agent)’가 주목받고 있다. 특히 B2B·B2G 현장에서는 복잡하고 반복적인 문서 업무를 대신해 처리하는 AI의 수요가 급증하고 있다. 한국딥러닝이 개발한 ‘딥 에이전트’는 이런 산업적 니즈에 정확히 부합하는 제품이다.
올해 상반기, ‘딥 에이전트’는 출시 2개월 만에 한국벤처투자, 현대캐피탈, 국세청, KT 등과의 계약을 성사시키며 누적 수주 9억원을 기록했다. 도입 기간과 비용을 획기적으로 절감하며 기술력으로 어필한 결과였다.
딥 에이전트가 기존 OCR 솔루션과 다른 결정적 차이는 ‘템플릿 없이 작동한다’는 점이다. 기존 문서 자동화 시스템은 특정 형식에 맞춘 템플릿을 만들어야 했다. 하지만 실제 문서는 기업마다 양식이 다르고, 디자인도 제각각이다. 딥 에이전트는 문서를 통째로 드래그 앤 드롭하면 AI가 자동으로 맥락을 분석해 키와 밸류를 추출한다. 김 대표는 “현재의 OCR 기술은 정확도가 중요한 단계는 넘어섰다”며 말을 이어갔다.
“정확도는 기본이고 이제는 문서의 맥락을 읽는 것이 더 중요해지고 있죠. OCR 기능은 문제 없다고 해도 문서 맥락을 읽는 부분은 회사마다 편차가 큰 상황이예요. 가령 ‘김지현’이라는 이름이 문서에 있을 때 이 것이 신청인인지 아니면 계약 금액 등과 같은 값인지 혹은 납기일인지를 파악하는 것이 포인트죠. 기존에는 문서 각 부분을 레이블링을 해줘야 했어요. 결국 수작업이 필요한 상황이었죠. 딥 에이전트는 그런 페인포인트를 해결한, 이를테면 4세대 OCR 기술이라고 할 수 있어요.”
그러면서 김 대표는 딥 에이전트의 특징을 ‘Zero Training’ ‘Zero Period’ ‘Zero Data’로 설명했다. 사전 학습(Zero Training) 없이 적용 가능하고, 도입 기간(Zero Period)도 10일 이내, 신규 문서를 위한 추가 데이터 수집도 필요 없는(Zero Data) 구조라는 것이다. 여기에 더해 딥 에이전트는 문서 처리에서 끝나지 않는다. 이후 단계로 연결되는 자동화까지 고려됐다. 김 대표는 “에이전트 생태계가 막 열리는 상황에서 딥 에이전트는 에이전트 이코노미의 시작점에 도달한 것”이라며 말을 이어갔다.
ⓒTech42 |
“기술적인 토대는 이미 완성됐고, 이제는 기존 시스템과 연동할 수 있는 실행력, 업무 맥락에 맞춰 처리할 수 있는 응용력이 자동화의 가장 큰 포인트가 되고 있어요. 저희 딥 에이전트도 그 두 축에서 시작된 거고요. 가령 딥 에이전트는 사용자가 계약서와 견적서를 동시에 넣으면, 두 문서 간 금액이 일치하는지를 자동으로 검증합니다. 이를 테면 문서 내용을 분석해 이상 값을 감지하고, 다음 액션을 유도하는 ‘검증 AI(Verification AI)’ 같은 기능들이 적용돼 A2A(Agent to Agent, AI 에이전트들끼리 직접 대화하고 협업하는 방식)로 모든 문서에 워크 플로우를 자동화하자는 것이 저희 출발선이었어요. 즉 저희 딥 에이전트에 문서를 던져주면 알아서 맥락을 파악하고 사용자가 필요한 것만을 추출해 요즘 다양하게 개발되는 각 LLM사의 AI 에이전트와 연결돼 활용될 수 있게 하는 거죠.”
실제 한국딥러닝은 글로벌 RPA(Robotic Process Automation로봇 프로세스 자동화) 솔루션과도 연동하는 등 다양한 LLM 기반 시스템들과 A2A를 통한 B2B 모델을 강화하고 있다. 엔비디아의 인셉션 프로그램에 선정돼 엘리트 파트너 활동할 수 있는 이유도 그 때문이다.
김 대표는 “다양한 기업들에서 개발돼 나오는 AI 자동화, AI 에이전트 시스템의 앞단에 딥 에이전트를 붙여 고객들이 빠르게 사용할 수 있게 하는 방식으로 적용되고 있다”며 “최근 화두가 되고 있는 MCP(Model Context Protocol, 다양한 외부 도구 및 데이터 소스와 AI 에이전트가 보다 원활하게 상호작용할 수 있도록 설계된 개방형 프로토콜) 역시 연구를 진행 중”이라고 덧붙였다.
6년차 스타트업이 투자 없이 성장할 수 있었던 비결은 ‘PMF 집중’
한국딥러닝이 여느 기술 스타트업과 다른 또 한 가지는 창업 이후 이제까지 투자 없이 자생적인 매출로 성장을 이어왔다는 점이다. 그 비결에 대해 김 대표는 “PMF(제품시장적합도)에 집중했다”며 말을 이어갔다.
“창업 당시부터 LLM 개발사들로부터 다양한 문의가 쇄도했어요. 지금도 하루에도 몇 건씩 문의가 들어오죠. 그런 문의와 요구사항을 모두 딥 에이전트에 반영했어요. 처음 개발을 할 때부터 LLM사들과 협업을 하기도 했고요. 가령 LLM사들은 보통 RAG(검색증강생성)로 업무를 많이 짜는데 이를 위해서는 백터 데이터 DB가 필요해요. 이 백터 DB를 만들려면 앞단에서 청킹(Chunking, 긴 텍스트 데이터를 더 작은 단위로 나누는 과정)을 적용하고 구조화하는 작업이 필요한데, 이때 딥 에이전트가 적용되기도 하죠.”
이렇듯 생성형 AI와 LLM 서비스의 확산 속에서 딥 에이전트의 효용성은 더욱 확대되고 있다. 한국딥러닝은 이러한 성과를 바탕으로 오는 2028년 IPO(기업공개)라는 목표를 세우고, 최근 조심스레 투자 유치를 시작했다.
ⓒTech42 |
“정답은 없지만, 최근까지 투자 없는 성장을 택한 이유는 제가 가지고 있는 상황에서 최선의 선택이었다고 생각해요. 가치를 입증하며 차근차근 본질을 닦아 나가지 않으면 아무도 우리를 믿어줄 수 없을 거라는 게 제 창업의 기조였죠. 이제는 성과나 고객 만족도 등을 통해 어느 정도 증명은 끝났다고 생각해요. 그 사이 투자 제안은 많이 받았지만, 기존 OCR 분야의 SI(시스템 통합) 방식 비즈니스로는 한계가 있다고 판단했어요. 대신 프로덕트로 승부해야 한다고 생각했죠. 이제는 프로젝트가 아니라 프로덕트로 승부를 할 수 있게 됐고 대규모 자본이 들어왔을 때 확실히 J커브(스타트업이 거치는 폭발적인 성장 단계)를 그릴 수 있겠다는 확신이 들어 투자 라운드를 오픈했어요.”
이 와중에도 한국딥러닝의 데이터 스노우 볼은 계속 굴러가고 있다. 이를 바탕으로 한국딥러닝은 장차 문서를 넘어 AGI(일반인공지능) 시대를 겨냥한 3D 데이터 에셋도 구축하는 중이다.
인터뷰 말미, 김 대표는 “앞으로도 철저하게 고객의 ROI를 고려한 AI 비전 솔루션을 만들어 나갈 계획”이라며 “딥 에이전트를 AI 시대 LLM 기업들이 채택하는 필수 솔루션으로 지속 강화해 나갈 것”이라는 포부를 밝혔다.
“구체적으로 밝힌 수는 없지만 모 LLM사와 130억원 규모의 대형 프로젝트 협업이 활발하게 진행되고 있어요. 이처럼 돈을 벌며 성장에 집중하는 저희 한국딥러닝의 기조는 앞으로도 계속 유지될 거예요. 앞으로도 다앙한 LLM사의 AI 에이전트 서비스의 앞 단에 저희 딥 에이전트가 필수로 적용되도록 하는데 더욱 집중할 계획입니다.”
황정호 기자
저작권자 © Tech42 - Tech Journalism by AI 테크42 무단전재 및 재배포 금지




























































