앤트로픽, 소네트 5 출시…에이전틱 작업 비용 절감
작성일 수정일
앤트로픽 클로드 소네트 5 출시, 입력 토큰 100만개당 2달러 출시 기념 가격
오푸스 4.8 근접 성능을 더 낮은 가격에 제공하는 에이전틱 특화 모델

앤트로픽(Anthropic)이 6월 30일(현지시각) 새 AI 모델 '클로드 소네트 5(Claude Sonnet 5)'를 공개했다. 이 모델은 자율적으로 계획을 세우고 브라우저·터미널 같은 도구를 활용하는 에이전틱(agentic) 작업에 특화됐다. 불과 몇 달 전만 해도 더 크고 비싼 모델이 필요했던 수준의 자율 작업을 처리할 수 있다는 것이 앤트로픽의 설명이다. 프리(Free)·프로(Pro) 플랜의 기본 모델로 채택됐으며 맥스(Max)·팀(Team)·엔터프라이즈(Enterprise) 사용자도 이용할 수 있다. 클로드 코드(Claude Code)와 클로드 플랫폼에서도 사용 가능하다.
에이전틱 AI 시대의 '가성비' 전략
앤트로픽은 소네트 5를 "몇 달 전까지 더 크고 비싼 모델이 필요했던 수준의 에이전틱 작업을 수행할 수 있는 모델"로 정의한다. 브라우저와 터미널 같은 외부 도구를 활용해 계획을 세우고 자율적으로 실행하는 능력을 갖췄다. 앤트로픽의 발표에 따르면 초기 접근 파트너들의 평가는 일관됐다. "이전 소네트 모델들이 중간에 멈추던 복잡한 작업을 끝까지 완수하고, 명시적으로 요청하지 않아도 스스로 결과물을 점검한다"는 것이다.
에이전틱 AI는 인간이 만드는 쿼리보다 훨씬 많은 양의 요청을 모델에 보내기 때문에 기업 고객들의 AI 토큰 비용이 급증하는 원인이 됐다. 이른바 '토큰맥싱(tokenmaxxing)', 즉 AI 과다 의존은 세계 최대 기술 기업들도 감당하기 어려운 수준이 됐고 메타(Meta), 아마존(Amazon), 우버(Uber)도 불필요한 AI 토큰 사용을 줄이기 위한 조치에 나섰다. 소네트 5는 새 토크나이저를 적용해 에이전틱 사용량이 많은 이용자에게 더 높은 효율을 제공한다.

벤치마크로 확인된 성능 도약
앤트로픽이 공개한 벤치마크 결과를 보면 소네트 5는 전작 소네트 4.6을 전 분야에서 뛰어넘고 상위 모델인 오푸스 4.8(Opus 4.8)에 근접한 수치를 보였다.
에이전틱 코딩 지표 SWE-bench Pro에서 소네트 5는 63.2%를 기록했다. 소네트 4.6(58.1%)보다 높고 오푸스 4.8(69.2%)에 가까워진 수치다. 터미널-벤치(Terminal-Bench) 2.1에서는 80.4%를 달성해 소네트 4.6(67.0%)을 크게 앞질렀다. 다학문 추론 평가 Humanity's Last Exam에서는 도구 사용 기준 57.4%를 기록해 오푸스 4.8(57.9%)과 사실상 동률을 이뤘다. 컴퓨터 사용 평가 OSWorld-Verified에서도 81.2%로 전작(78.5%)을 웃돌았다. 실제 업무 지식을 테스트하는 GDPval-AA v2 벤치마크에서는 소네트 5가 1,618점으로 오푸스 4.8(1,615점)을 소폭 앞질렀다.
앤트로픽은 "오푸스 4.8은 미세한 판단이나 심층 리서치 같은 고난도 과제에서 여전히 최선의 선택이지만, 소네트 5는 이전에 가능했던 것보다 훨씬 높은 품질의 저비용 옵션을 개발자에게 제공한다"고 설명했다.
가격 경쟁력과 시장 파장
소네트 5의 출시 가격은 입력 토큰 100만 개당 2달러, 출력 토큰 100만 개당 10달러다. 이 출시 가격은 2026년 8월 31일까지 적용되며, 9월 1일부터는 입력 100만 토큰당 3달러, 출력 100만 토큰당 15달러로 오른다. 비교하면 오푸스 4.8은 입력 100만 토큰당 5달러, 출력 100만 토큰당 25달러다. 소네트 5는 오픈AI(OpenAI)의 GPT-5.5, 구글(Google)의 제미나이 3.1 프로(Gemini 3.1 Pro)보다도 저렴하다. 다만 구글의 제미나이 3.5 플래시(Gemini 3.5 Flash)보다는 여전히 비싸다.
경쟁사들도 에이전틱 모델을 잇달아 선보이고 있다. 오픈AI는 지난주 GPT-5.6 솔(Sol)을 프리뷰로 출시했으며, 구글은 5월에 제미나이 3.5 플래시를 공개했다. 테크크런치(TechCrunch)는 소네트 5의 등장에 대해 "에이전틱 기능이 모든 가격대에서 새로운 기본 기대치가 됐음을 확인해 준다"며 "이제 차별화 요소는 누가 에이전틱 작업을 가장 잘 하느냐가 아니라, 얼마나 저렴하게 그리고 인간 감독 없이 얼마나 안정적으로 할 수 있느냐"라고 분석했다.
사이버보안 우려 해소와 IPO 준비
최근 앤트로픽은 미국 정부가 최상위 모델인 미토스 5(Mythos 5)와 페이블 5(Fable 5)에 대해 사이버보안 우려를 이유로 배포를 차단하면서 어려움을 겪었다. 소네트 5 출시에는 이런 우려를 선제적으로 불식하려는 의도도 담겨 있다.
앤트로픽에 따르면 소네트 5는 사이버보안 과제용으로 훈련되지 않았다. 소프트웨어 익스플로잇 작성 등 위험 역량 테스트에서도 오푸스 4.8 및 미토스 5보다 훨씬 낮은 점수를 기록했다. 다만 전작 소네트 4.6보다는 해당 점수가 소폭 높아, 앤트로픽은 사이버 안전장치를 기본 활성화 상태로 설정했다. 이 안전장치는 오푸스 4.7·4.8에 적용된 수준과 동일하며 위험한 사이버 사용을 실시간으로 감지하고 차단한다. 앤트로픽은 소네트 5의 전반적인 사이버보안 위험도를 '낮음'으로 평가하고 있다.
한편 앤트로픽은 올해 안에 기업공개(IPO)를 예고하며 이미 미국 증권거래위원회(SEC)에 비공개로 서류를 제출한 것으로 알려진다. 소네트 5 출시는 이러한 상장 준비 행보와도 맞닿아 있다는 시각이 있다.