2026년 6월 30일, Anthropic은 공식적으로 Claude Sonnet 5를 발표했습니다. 이번 업데이트의 초점은 단일 턴 대화 점수가 아니라, Sonnet 수준의 모델이 계획, 브라우저 및 터미널 사용, 그리고 다단계 작업을 지속적으로 수행하는 데 더 잘 맞춰져 있습니다. Anthropic은 전체 역량이 Opus 4.8과 비슷하지만 운영 비용이 더 낮다고 밝혔습니다.
Sonnet 5는 이제 모든 Claude 요금제에서 이용 가능하며, 무료 및 Pro 요금제의 기본 모델이 되었습니다; Claude 코드와 Claude API도 제공되며, API 모델은 claude-sonnet-5입니다.
핵심 변화는 '일을 해내기'입니다
Sonnet 4.6은 이미 코드 작성과 도구 호출을 지원하며, Sonnet 5는 더 긴 실행 체인에 초점을 맞춥니다. 공식 팀이 선보인 초기 테스트 시나리오에는 실제 코드 웨어하우스 처리, 오류 디버깅, 여러 도구 호출, 그리고 작업 중 결과 검증이 포함됩니다.
이는 프로그래밍 에이전트와 비즈니스 자동화에 더 가치가 있습니다. 사용자가 진정으로 신경 쓰는 것은 모델이 함수를 작성할 수 있느냐가 아니라, 컨텍스트를 추적하고, 프로젝트 계약을 준수하며, 테스트를 완료하고, 문제가 발생했을 때 계속 진행할 수 있느냐입니다. 하지만 'Opus 4.8에 가깝다'는 것이 모든 작업이 동일한 수준이라는 뜻은 아닙니다; 공식 입장에서는 고노력 설정이 특정 작업에서 Opus와 일치할 수 있다는 것입니다.
가격은 내려가지만, 청구서가 반드시 비례적으로 줄어드는 것은 아닙니다
2026년 8월 31일 기준, Sonnet 5 도입 기간의 API 가격은 입력 토큰 백만 개당 2달러, 출력 토큰 백만 개당 10달러입니다; 이후 가격은 3달러와 15달러로 회복되었습니다. 같은 기간 동안 Opus 4.8은 $5와 $25였기 때문에, 많은 도구 호출이 필요한 작업은 명확한 비용 마진을 가졌습니다.
하지만 Sonnet 5는 새로운 토큰 시스템으로 전환했습니다. Anthropic은 동일한 입력이 콘텐츠 유형에 따라 원래 토큰의 약 1.0-1.35배를 생성할 수 있음을 상기시킵니다. 팀이 마이그레이션 평가를 수행할 때는 단가만 보는 것이 아니라 전체 작업의 총 토큰, 성공률, 인간 인수인수 수를 비교해야 합니다.
누가 먼저 업그레이드할 가치가 가장 높을까요?
이미 Claude 코드, 브라우저 검색, 터미널 명령, 또는 롱링크 자동화에 의존하는 워크플로우라면, 소규모 A/B 테스트에 Sonnet 5를 우선시할 가치가 있습니다. 일반적인 채팅, 짧은 텍스트 재작성, 일회성 Q&A에서는 새로운 모델의 가치가 에이전트 시나리오만큼 명확하지 않을 수 있습니다.
안전 측면에서 Anthropic은 소네트 5가 4.6보다 환각과 아첨이 적으며, 즉각적인 주입에 대한 저항성도 향상되었다고 보도했습니다; 하지만 이건 여전히 출판사들의 평가일 뿐입니다. 라이브 전에 더 안전한 방법은 팀의 자체 코드베이스, 권한 경계, 실패 샘플을 활용해 재테스트한 후 기존 모델을 교체할지 결정하는 것입니다.