[박찬 기자]
앤트로픽이 플래그십 인공지능(AI) 모델 '클로드 4(Claude 4)' 시리즈를 출시했다. 전반적인 성능 면에서 현존 최고를 기록하지는 못했지만, 앤트로픽의 장기인 코딩과 도구 사용을 통한 에이전트 기능 등에서는 큰 발전을 이뤘다.
앤트로픽은 22일(현지시간) '클로드 4 오퍼스(Opus)'와 '클로드 4 소네트(Sonnet)'를 공식 출시했다.
최상위 모델인 클로드 4 오퍼스는 지금까지 앤트로픽이 개발한 가장 강력한 AI로 평가받으며, 복잡한 질문에 대한 답변부터 코드 작성까지 다양한 작업에서 더 높은 자율성과 정확도를 보여준다.
앤트로픽이 플래그십 인공지능(AI) 모델 '클로드 4(Claude 4)' 시리즈를 출시했다. 전반적인 성능 면에서 현존 최고를 기록하지는 못했지만, 앤트로픽의 장기인 코딩과 도구 사용을 통한 에이전트 기능 등에서는 큰 발전을 이뤘다.
앤트로픽은 22일(현지시간) '클로드 4 오퍼스(Opus)'와 '클로드 4 소네트(Sonnet)'를 공식 출시했다.
최상위 모델인 클로드 4 오퍼스는 지금까지 앤트로픽이 개발한 가장 강력한 AI로 평가받으며, 복잡한 질문에 대한 답변부터 코드 작성까지 다양한 작업에서 더 높은 자율성과 정확도를 보여준다.
앤트로픽은 2024년 초 '클로드 3 오퍼스'를 포함한 세가지 모델을 선보인 바 있다. 하지만 이후 가장 큰 오퍼스만 후속 업데이트가 이뤄지지 않았고, 끝내 회사는 3.5 버전 출시 계획을 철회했다.
다른 회사들과 마찬가지로 스케일링 법칙의 한계에 막혀 차별화된 성능 향상을 이루지 못했기 때문이다. 대신, 앤트로픽은 모든 역량을 오퍼스 4 개발에 집중했고 이번에 크게 성능 향상을 이루게 됐다.
오퍼스 4는 기존 AI 모델들이 수분 내외의 짧은 집중 시간에 한정됐던 것에서 진일보, 수천 단계에 걸친 장기적인 작업을 안정적으로 수행할 수 있도록 설계됐다.
특히, 독립적으로 장시간 코딩을 가능하게 해준다. 초기 테스트 참여 업체 중 하나인 라쿠텐 그룹은 오퍼스 4에 24시간 동안 포켓몬 게임을 플레이하도록 설정하고, 동시에 무려 7시간 동안 코딩 개선을 진행할 수 있었다고 밝혔다.
이는 이전 모델인 클로드 3.7 소네트가 45분가량 진행했던 것과 비교해 월등한 진보다. 또, 최근 AI 에이전트의 추세인 병렬 처리와 비동기 작동이 가동하다는 것을 보여준다.
오퍼스 4는 소프트웨어 엔지니어링 벤치마크 'SWE-벤치'에서 72.5%를 기록, 코딩 특화 모델인 오픈AI의 'GPT-4.1(54.6%)'와 구글의 '제미나이 2.5 프로(63.2%)' 등을 크게 능가했다.
그러나 모든 지표에서 1위를 차지하지는 못했다. 멀티모달 평가인 'MMMU'나 박사 수준의 과학 지식 문제를 포함한 'GPQA 다이아몬드'에서는 오픈AI의 o3를 넘지 못했다.
대신 도구 활용을 추론 과정에 직접 통합한 것이 강점이다. 오퍼스 4와 소네트 4는 검색 엔진과 같은 다양한 도구들을 병렬적으로 사용, 추론과 도구 사용을 번갈아 가며 정교한 답변을 생성한다.
또 사용자 요청에 따라 순차적 사고(논리적 추론)와 즉각적 반응을 모두 제공할 수 있는 '비추론-추론 하이브리드 모델'로 설계됐다.
기억 유지(memory persistence) 기능 역시 크게 향상됐다. 문서에서 핵심 정보를 추출하고 요약 파일을 생성하면, 이후 작업에서도 이를 유지할 수 있다. 이로써 장기 프로젝트에서 맥락을 잃어버리는 '망각 문제'를 해결하게 됐다.
앤트로픽도 클로드 4를 "복잡하고 장시간 실행되는 작업과 에이전트 워크플로에서 지속적인 성능을 제공하는 세계 최고의 코딩 모델"이라고 소개했다.
또 "가상 협업을 향한 중요한 발걸음으로, 완전한 맥락을 유지하고 장기 프로젝트에 집중하며 혁신적인 영향을 이끌어낸다"라며 사용성을 강조했다.
앤트로픽은 이날 코딩 작업에 특화된 새로운 AI 도구 '클로드 코드(Claude Code)'도 정식 출시했다.
이전까지 베타 버전으로만 제공됐던 이 도구는 이제 IDE(통합 개발 환경)와 통합되며, VS 코드와 젯브레인, 깃허브용 확장 기능도 함께 제공된다. 특히 깃허브 커넥터는 코드 리뷰 피드백에 자동 응답하거나, 오류를 수정하는 등의 작업을 가능하게 한다.
이 외에도 앤트로픽 API를 통해 네가지 새로운 기능을 추가했다. 코드 실행 도구 모델 컨텍스트 프로토콜(MCP) 커넥터 파일 API 프롬프트 캐싱(최대 1시간 유지) 기능 등이 포함됐다. 이를 통해 개발자들은 강력한 AI 에이전트를 구축할 수 있다.
소네트 4는 무료 및 유료 사용자 모두가 사용할 수 있지만, 오퍼스 4는 유료 사용자에게만 제공된다.
API는 아마존 '베드록'과 구글 '버텍스 AI'를 통해 제공되며, 오퍼스 4는 입력 토큰 100만개당 15달러, 출력 토큰 100만개당 75달러로 책정됐다. 소네트 4는 각각 3달러, 15달러다.
박찬 기자 cpark@aitimes.com
<저작권자 Copyright ⓒ AI타임스 무단전재 및 재배포 금지>
































































