[박찬 기자]
오픈AI가 복잡한 작업을 위해 인터넷에서 다단계 심층 연구를 수행하는 새로운 인공지능(AI) 에이전트 '딥 리서치(Deep Research)'를 출시했다. 특히 벤치마크 사상 가장 어렵다는 '인류의 마지막 시험(Humanity's Last Exam)' 테스트에서 26.6% 정답을 기록, '딥시크-R1'의 9.4%를 2.8배나 앞섰다.
오픈AI는 2일(현지시간) 챗GPT를 사용해 심층적이고 복잡한 연구를 수행할 수 있는 새로운 AI 에이전트 '딥 리서치'를 출시했다.
이는 샘 알트먼 CEO가 지난달 30일 워싱턴 D.C.에서 미국 정부 관계자들과 만나 공개한 것으로 알려진 '박사급 슈퍼 에이전트(Ph.D.-level super-agents)'로 보인다.
오픈AI가 복잡한 작업을 위해 인터넷에서 다단계 심층 연구를 수행하는 새로운 인공지능(AI) 에이전트 '딥 리서치(Deep Research)'를 출시했다. 특히 벤치마크 사상 가장 어렵다는 '인류의 마지막 시험(Humanity's Last Exam)' 테스트에서 26.6% 정답을 기록, '딥시크-R1'의 9.4%를 2.8배나 앞섰다.
오픈AI는 2일(현지시간) 챗GPT를 사용해 심층적이고 복잡한 연구를 수행할 수 있는 새로운 AI 에이전트 '딥 리서치'를 출시했다.
이는 샘 알트먼 CEO가 지난달 30일 워싱턴 D.C.에서 미국 정부 관계자들과 만나 공개한 것으로 알려진 '박사급 슈퍼 에이전트(Ph.D.-level super-agents)'로 보인다.
딥 리서치는 수백개의 온라인 출처를 찾아 분석하고 종합, 연구 분석가 수준의 포괄적인 보고서를 작성하는 것으로 알려졌다.
특히 웹 브라우징과 데이터 분석에 최적화된 'o3' 모델의 특별 버전으로 구동되며, 방대한 양의 텍스트와 이미지, PDF 파일 등을 검색하고 해석하고 분석하는 과정에서 필요에 따라 정보를 기반으로 방향을 전환하는 추론 능력을 활용한다.
오픈AI는 "금융, 과학, 정책, 엔지니어링과 같은 분야에서 집중적인 지식 작업을 수행하고 철저하고 정확하며 신뢰할 수 있는 연구가 필요한 사람들을 위해 구축했다"라고 밝혔다.
또 자동차나 가전제품, 가구와 같이 신중한 검토가 필요한 구매에 대해 개인화된 추천이 가능, 쇼핑객에게도 유용할 수 있다고 덧붙였다. "여러 웹사이트를 탐색해야 하는 틈새시장의 비직관적인 정보를 찾는 데 효과적"이라며 "복잡하고 시간이 많이 걸리는 웹 연구를 단 하나의 쿼리로 신속하게 처리할 수 있기 때문에 귀중한 시간을 절약할 수 있다"라고 설명했다.
딥 리서치를 사용하려면, 프롬프트 작성기에서 옵션을 선택한 뒤 쿼리를 입력하면 된다. 파일이나 스프레드시트를 첨부할 수 있는 옵션도 제공된다. 질문에 답하는 데 5~30분 정도 소요될 수 있으며, 검색이 완료되면 알림을 받게 된다.
현재 딥 리서치의 출력은 텍스트만 가능하며, 곧 이미지와 그래프 출력 기능을 추가할 계획이다. 또 기업 내부 리소스를 포함한 데이터 소스와 연결하는 기능도 개발할 것으로 전해졌다.
샘 알트먼 CEO가 "딥시크보다 뛰어난 모델을 출시할 것"이라고 예고했듯, 벤치마크에서는 'R1'을 크게 앞질렀다.
특히 최근 공개된 '인류의 마지막 시험(HLE)' 평가에서 딥 리서치를 구동하는 o3 모델은 26.6%의 정확도를 기록, 새로운 최고 기록을 세웠다.
HLE는 다양한 학문 분야에서 3000개 이상의 전문가 수준 문제를 포함하는 현존 벤치마크 중 가장 높은 난이도의 시험이다. 이 테스트에 R1과 o1은 각각 9.4%, 9.1%로 10%에도 못 미쳤다.
또 '제미나이 싱킹(6.2%)', '그록-2(3.8%)', 'GPT-4o(3.3%)'에 비해서 딥 러시치는 몇배 이상의 정확도를 보였다.
특히, 딥 리서치의 등장은 o3의 본격 출시에 앞서 이뤄진 것으로 주목된다. 올 상반기 중 등장할 o3는 딥서치와는 비교가 안 될 정도로 뛰어난 성능이라는 것을 예고한 셈이다.
또 오픈AI는 지난달 23일 AI 에이전트 '오퍼레이터', 31일 'o3-미니'에 이어 열흘 주요 제품을 3가지나 출시하는 등 딥시크에 강력하게 대응하고 있다.
오픈AI는 "지식을 종합하는 능력은 새로운 지식을 창출하는 데 필수적"이라며 "딥 러서치는 인공일반지능(AGI)을 개발한다는 목표를 향한 중요한 단계를 나타내며, 이를 통해 새로운 과학 연구를 생산할 수 있을 것"이라고 강조했다.
딥 리서치는 먼저 월 200달러짜리 '챗GPT 프로' 사용자에게 제공되며, 엄청난 컴퓨팅 리소스를 필요로 하기 때문에 쿼리는 월 100개로 제한된다. 플러스와 팀 사용자도 곧 지원될 예정이며, 이후 엔터프라이즈로 확장될 예정이다.
영국, 스위스, 유럽의 출시 일정은 공개하지 않았다. 또 현재는 웹에서만 제공되며, 모바일 및 데스크톱 앱 통합은 이번 달 말 이뤄질 예정이다.
박찬 기자 cpark@aitimes.com
<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
































































