속성-관계 데이터 통합 처리 기술 개발
LLM 한계 넘는 고성능 에이전트 가능
국방·조선·반도체 기업, 개념검증 진행
할루시네이션(환각)을 최소화하고 실시간 데이터 기반으로 정확한 답변을 내놓는 고성능 인공지능(AI) 에이전트를 구현할 수 있는 기반기술이 나왔다. 복잡한 데이터 관계를 한 번에 분석하고 처리해 거대언어모델(LLM)의 한계를 극복하는 기술이다.
한국과학기술원(KAIST·카이스트)은 김민수 전산학부 교수 연구진이 표와 그래프를 동시에 처리하는 데이터베이스(DB) 기술 '키마이라(Chimera)'를 개발했다고 8일 밝혔다. 엑셀처럼 표 형식으로 정보를 저장·조회하는 관계형 DB와, 복잡한 관계를 점과 선으로 표현하는 그래프 DB를 한 시스템 안에서 통합해 사용할 수 있도록 설계한 것이다.
연구진에 따르면 국방, 조선, 반도체, 통신 등 다양한 산업에서 이 기술 도입에 관심을 보이고 있다. 연내 주요 기업들과 개념 검증을 거쳐 내년부터 본격 상용화에 들어갈 수 있을 것으로 연구진은 예상하고 있다. 김 교수는 "기업들이 보유한 다양한 형태의 데이터를 통합적으로 활용할 수 있게 해 AI 서비스의 신뢰도와 응답 정확도를 크게 높일 수 있다"고 말했다.
LLM 한계 넘는 고성능 에이전트 가능
국방·조선·반도체 기업, 개념검증 진행
생성형 AI 챗GPT 로고가 표시된 스마트폰이 컴퓨터 메인보드 위에 위에 놓여 있다. 연합뉴스 |
할루시네이션(환각)을 최소화하고 실시간 데이터 기반으로 정확한 답변을 내놓는 고성능 인공지능(AI) 에이전트를 구현할 수 있는 기반기술이 나왔다. 복잡한 데이터 관계를 한 번에 분석하고 처리해 거대언어모델(LLM)의 한계를 극복하는 기술이다.
한국과학기술원(KAIST·카이스트)은 김민수 전산학부 교수 연구진이 표와 그래프를 동시에 처리하는 데이터베이스(DB) 기술 '키마이라(Chimera)'를 개발했다고 8일 밝혔다. 엑셀처럼 표 형식으로 정보를 저장·조회하는 관계형 DB와, 복잡한 관계를 점과 선으로 표현하는 그래프 DB를 한 시스템 안에서 통합해 사용할 수 있도록 설계한 것이다.
연구진에 따르면 국방, 조선, 반도체, 통신 등 다양한 산업에서 이 기술 도입에 관심을 보이고 있다. 연내 주요 기업들과 개념 검증을 거쳐 내년부터 본격 상용화에 들어갈 수 있을 것으로 연구진은 예상하고 있다. 김 교수는 "기업들이 보유한 다양한 형태의 데이터를 통합적으로 활용할 수 있게 해 AI 서비스의 신뢰도와 응답 정확도를 크게 높일 수 있다"고 말했다.
현재 시스템에선 관계형과 그래프 DB를 별도로 운영하는 경우가 많다. 관계형 DB는 고객 정보나 거래 내역처럼 구조가 명확한 데이터를 다루는 데 적합하고, 그래프 DB는 사람과 사람, 사건과 장소처럼 복잡하게 얽힌 관계를 분석할 때 유리하다. 하지만 구조가 다른 두 시스템을 함께 쓰면 처리 속도가 느려지고, 데이터의 최신성이나 일관성 유지에도 한계가 있다.
관계형 데이터와 그래프 데이터를 동시에 처리할 수 있는 기술을 개발한 한국과학기술원(KAIST·카이스트) 전산학부의 김민수(오른쪽) 교수와 이건호(가운데) 박사과정생. AI 스타트업 그래파이의 박정호(왼쪽 위 원 안) 엔지니어도 개발에 참여했다. 카이스트 제공 |
연구진은 이런 문제를 '이중 저장 방식(듀얼 스토어 구조)'과 '탐색-조인 연산자'로 해결했다. 관계 구조와 속성 정보를 따로 저장하되 서로 연결해 질문에 답할 수 있도록 구성한 것이다. 이렇게 하면 '환자 A와 유사한 진료 기록을 가진 다른 환자들이 최근 복용 중인 약물은 무엇인가' 같은 복잡한 질문도 빠르고 정확하게 처리할 수 있다.
기존 AI는 학습된 범위 내에서만 답할 수 있지만, 키마이라를 기반으로 하면 최신 데이터와 연결된 정보까지 탐색하고 답을 도출할 수 있다고 연구진은 설명했다. 검색증강생성(RAG) 구조와 결합하면 LLM의 한계도 보완할 수 있다. '더 똑똑한' AI 서비스 구현이 가능하다는 의미다. 먼저 개발된 통합 DB 시스템이 있긴 하지만, 국제 벤치마크 결과 키마이라는 기존 기술보다 최대 280배 빠른 속도를 기록했다고 연구진은 전했다.
김태연 기자 tykim@hankookilbo.com




























































