컨텐츠로 건너뛰기
뉴스
서울
맑음 / -3.9 °
매일경제 언론사 이미지

“챗GPT보다 코딩 잘한다”…세계 최고 수준 기록했다는 AI 모델의 정체

매일경제 이상규 매경 디지털뉴스룸 기자(boyondal@mk.co.kr)
원문보기
코딩 벤치마크서 80.9% 기록
API 가격도 3분의 1로 인하


앤트로픽. [사진출처 = 연합뉴스]

앤트로픽. [사진출처 = 연합뉴스]


인공지능(AI) 챗봇 ‘클로드’를 운영하는 앤트로픽이 새 AI 모델을 선보이며 코딩과 에이전트 등 분야에서 세계 최고 수준을 기록했다고 강조했다.

앤트로픽은 자사 AI 모델 중 최상위 모델인 ‘오퍼스’의 최신 버전 ‘클로드 오퍼스4.5’를 24일(현지시간) 출시했다.

앤트로픽은 오퍼스, 소넷, 하이쿠 등 3종류의 AI 모델을 제공하고 있다. 오퍼스는 가장 복잡한 추론과 전문 작업에 적합한 모델이고 소넷과 하이쿠는 이보다 경량 모델이다.

앤트로픽은 오퍼스4.5가 에이전트 코딩 능력을 보여주는 소프트웨어 공학(SWE) 벤치마크에서 80.9%의 성능을 보여 경쟁사 모델보다 우위를 점했다고 설명했다.

오픈AI의 GPT-5.1 코덱스 맥스는 같은 벤치마크에서 77.9%를, 구글이 지난 18일 출시한 ‘제미나이3 프로’는 76.2%를 각각 기록했다.

또 훈련 데이터에 없는 과제를 푸는 ARC-AGI-2 벤치마크에서도 37.6%로 제미나이3 프로(31.1%)와 GPT-5.1(17.6%)보다 뛰어난 성과를 얻었다.


오퍼스4.5는 이날부터 클로드 앱과 API와 함께 아마존웹서비스(AWS), 마이크로소프트 ‘애저’, 구글 클라우드 등 3대 클라우드 플랫폼에서 이용할 수 있다.

앤트로픽은 오퍼스4.5 출시와 함께 API 사용료도 크게 낮춰 100만 토큰당 입력 5달러, 출력 25달러로 책정했다.

이는 100만 토큰당 입력 15달러, 출력 75달러였던 기존 요금의 3분의 1 수준이다.

[ⓒ 매일경제 & mk.co.kr, 무단 전재, 재배포 및 AI학습 이용 금지]

info icon이 기사의 카테고리는 언론사의 분류를 따릅니다.

AI 이슈 트렌드

실시간
  1. 1베네수 부두 폭격
    베네수 부두 폭격
  2. 2푸틴 관저 공격
    푸틴 관저 공격
  3. 3유재석 대상
    유재석 대상
  4. 4모바일 어르신 교통카드
    모바일 어르신 교통카드
  5. 5이시영 캠핑장 민폐 논란
    이시영 캠핑장 민폐 논란

매일경제 하이라이트

파워링크

광고
링크등록

당신만의 뉴스 Pick

쇼핑 핫아이템

AD