Claude Sonnet 5 发布：智能体能力逼近 Opus，价格更低

2026 年 6 月 30 日，Anthropic 在官方公告中发布 Claude Sonnet 5。这次更新的重点不是单轮对话分数，而是让 Sonnet 级模型更善于制定计划、使用浏览器和终端、连续执行多步任务。Anthropic 称其整体能力已接近 Opus 4.8，但使用成本更低。

Sonnet 5 已向 Claude 各套餐开放，并成为 Free 和 Pro 套餐的默认模型；Claude Code 和 Claude API 也已可使用，API 模型名称为 claude-sonnet-5。

Sonnet 4.6 已经能写代码和调用工具，Sonnet 5 则把重心放到更长的执行链上。官方展示的早期测试场景包括处理真实代码仓库、调试故障、调用多种工具，以及在过程中自行检查结果。

这对编程智能体和业务自动化更有价值：用户真正在意的不是模型能否写出某个函数，而是它能否追踪上下文、遵守项目约定、完成测试，并在中途遇到问题时继续推进。不过，“接近 Opus 4.8”不等于所有任务都达到同一水平，官方的表述是高 effort 设置在部分任务上可以匹配 Opus。

截至 2026 年 8 月 31 日，Sonnet 5 的介绍期 API 价格为每百万输入 token 2 美元、每百万输出 token 10 美元；之后恢复为 3 美元和 15 美元。同期 Opus 4.8 为 5 美元和 25 美元，因此需要大量工具调用的任务有明显的成本空间。

但 Sonnet 5 换用了新 tokenizer。Anthropic 提醒，同样的输入可能会变成原来约 1.0-1.35 倍的 token，具体取决于内容类型。团队做迁移评估时，应比较一个完整任务的总 token、成功率和人工接管次数，不能只看单价。

如果工作流已经依赖 Claude Code、浏览器搜索、终端命令或长链路自动化，Sonnet 5 值得优先做小规模 A/B 测试。而对普通聊天、短文改写和一次性问答，新模型的价值未必会像智能体场景那么明显。

安全方面，Anthropic 报告称 Sonnet 5 比 Sonnet 4.6 更少出现幻觉和谄媚，对提示词注入的抵抗也有改善；但这些仍是发布方的评估结果。上线前更稳妥的做法，是用团队自己的代码库、权限边界和失败样本复测，再决定是否替换现有模型。

推荐工具