컨텐츠로 건너뛰기
뉴스
서울
맑음 / -3.9 °
디지털투데이 언론사 이미지

구글 딥마인드, 제미나이3 프로 세부 성능 공개…문서·공간·영상 이해력 혁신

디지털투데이
원문보기
[AI리포터]

[디지털투데이 AI리포터] 구글 딥마인드가 지난 11월 출시된 인공지능(AI) 모델 '제미나이3 프로'(Gemini 3 Pro)의 구체적인 성능과 기술적 성과를 공개했다.

8일(현지시간) 온라인 매체 기가진에 따르면, 로한 도시(Rohan Doshi) 구글 딥마인드 제품 매니저는 "제미나이3 프로는 당사 역사상 가장 강력한 멀티모달 모델로, 문서 이해, 공간 이해, 화면 이해, 영상 이해 모든 영역에서 최고 성능을 발휘한다"고 설명했다.

먼저 문서 이해 분야에서 제미나이3 프로는 난해한 손글씨, 복잡한 표 구조, 수식, 비선형 레이아웃을 HTML, 라텍스(LaTeX), 마크다운(Markdown) 코드로 변환할 수 있다. 예를 들어, 18세기 상인의 자필 수첩을 재구성하거나 복잡한 수식을 읽어내며, 나이팅게일이 작성한 차트까지 정확히 해석한다.

공간 이해 측면에서도 오브젝트와 그 의도를 정확히 파악하며, 화면 이해 기능을 통해 PC 사용자 인터페이스(UI)를 인식하고 분석하는 능력을 갖췄다. 특히 영상 이해 부문에서 10FPS 처리 속도를 기록하며, 골프·테니스 스윙 분석 등 동작 이해에서도 뛰어난 성능을 보인다. 아울러 사고 모드에서는 단순히 영상 내용을 파악하는 것을 넘어 왜 그런 일이 일어나는지까지 추론한다.

또한 제미나이3 프로는 AI 모델의 추론 능력을 평가하는 'ARC-AGI-2' 테스트에서 54%라는 높은 점수를 기록했다. 작업당 비용은 31달러(약 4만6000원)로 타 AI 모델보다 높지만, 성능 면에서 압도적인 우위를 점하고 있다. 반면, 오픈AI GPT-5는 10% 점수에 1달러(약 1400원) 수준의 비용으로 저비용·고효율 전략을 택했다.

<저작권자 Copyright ⓒ 디지털투데이 (DigitalToday) 무단전재 및 재배포 금지>

info icon이 기사의 카테고리는 언론사의 분류를 따릅니다.

AI 이슈 트렌드

실시간
  1. 1베네수 부두 폭격
    베네수 부두 폭격
  2. 2푸틴 관저 공격
    푸틴 관저 공격
  3. 3유재석 대상
    유재석 대상
  4. 4모바일 어르신 교통카드
    모바일 어르신 교통카드
  5. 5이시영 캠핑장 민폐 논란
    이시영 캠핑장 민폐 논란

디지털투데이 하이라이트

파워링크

광고
링크등록

당신만의 뉴스 Pick

쇼핑 핫아이템

AD