컨텐츠로 건너뛰기
뉴스
서울
흐림 / 4.7 °
AI타임스 언론사 이미지

구글, 코딩 성능 더 강화한 '제미나이 2.5 프로' 업데이트 버전 공개

AI타임스 박찬
원문보기
[박찬 기자]

구글이 인공지능(AI) 모델 '제미나이 2.5 프로(Gemini 2.5 Pro)'의 최신 업데이트를 공개했다. 이번 버전은 "최고의 코딩 모델"이라는 이전 버전보다 코딩 성능을 더 강화한 것이 특징이다.

구글이 5일(현지시간) '제미나이 2.5 프로 프리뷰 06-05 싱킹'을 미리보기로 공개했다.

구글 AI 스튜디오와 버텍스 AI 플랫폼을 통해 기업과 개발자들이 테스트할 수 있으며, 앞으로 몇주 안에 정식 버전으로 출시될 예정이다.

지난달 I/O를 앞두고 출시한 'I/O 에디션'보다 향상된 성능을 자랑한다. 기업 규모의 애플리케이션 개발에 적합한 수준까지 완성됐다고 전했다.

https://twitter.com/sundarpichai/status/1930656033237823862

특히, 프로그래밍과 추론 분야에서 경쟁 모델들을 능가한다고 강조했다.


데미스 허사비스 딥마인드 CEO는 I/O 에디션이 당시 구글의 최고 코딩 모델이라고 평했지만, 이번 06-05 버전은 이를 더 개선했다고 소개했다.

내부 테스트에서는 전 버전보다 'LM아레나(LMArena)'에서는 24점이, '웹데브아레나(WebDevArena)'에서는 35점이나 올랐다.

외부 테스트에서는 225개의 까다로운 코딩 테스트로 구성된 '아이더 폴리글롯(Aider Polyglot)'에서는 오픈AI의 'o3'와 앤트로픽의 '클로드 4 오퍼스' 등을 제치고 이 부문 현재 1위를 기록 중이다.


그러나 '라이브코드벤치(LiveCodeBench)'나 'SWE-벤치 베리파이드(SWE-bench Verified)' 등에서는 다른 모델보다 뒤지며, 아직 최고의 코딩 모델이라고 부르기에는 조금 못 미친다.

대신, 수학과 과학, 지식 및 추론 능력을 평가하는 'GPQA'와 '인류의 마지막 시험(Humanity's Last Exam)' 등에서는 최고 수준의 성능을 보였다.


기능 측면에서도 두드러진 개선 사항을 보였다고 전했다.


구글은 "이전 버전에 대한 피드백을 반영해 응답 형식과 표현 스타일이 더욱 창의적이고 구조적으로 개선됐다"라고 밝혔다. 특히, 다양한 가설을 고려해 더 심층적인 답변을 생성하는 '딥 싱크(Deep Think)' 기능이 포함, 추론 능력이 더욱 강화됐다.

특이하게도, 벤치마크 성적과 API 가격을 같은 표에 포함해 다른 모델과 비교했다. 가격은 입력 100만 토큰당 1.25달러, 출력 100만 토큰당 10달러로, '딥시크-R1'과'o4-미니'를 제외하면 추론 모델 중 가장 싼 편이다.

이 모델은 업데이트 발표 몇시간 만에 이미 많은 개발자들이 테스트 중이다. "속도와 반응성이 개선됐다"라는 초기 평가가 이어지고 있다.

최근 AI 기반 코딩 도구에 대한 수요가 빠르게 늘어나는 가운데, 구글은 이처럼 지속적인 모델 개선을 통해 코딩 시장에서 주도권을 강화하려는 움직임을 보이고 있다.

박찬 기자 cpark@aitimes.com

<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>

info icon이 기사의 카테고리는 언론사의 분류를 따릅니다.

AI 이슈 트렌드

실시간
  1. 1이이경 유재석
    이이경 유재석
  2. 2대한항공 연승
    대한항공 연승
  3. 3대통령 국세청 방문
    대통령 국세청 방문
  4. 4김하성 애틀랜타 잔류
    김하성 애틀랜타 잔류
  5. 5손흥민 토트넘 동료
    손흥민 토트넘 동료

AI타임스 하이라이트

파워링크

광고
링크등록

당신만의 뉴스 Pick

쇼핑 핫아이템

AD