返回AI资讯
Claude Sonnet 5 发布:智能体能力逼近 Opus,价格更低

Claude Sonnet 5 发布:智能体能力逼近 Opus,价格更低

AI资讯 Admin 4 次浏览

2026 年 6 月 30 日,Anthropic 在官方公告中发布 Claude Sonnet 5。这次更新的重点不是单轮对话分数,而是让 Sonnet 级模型更善于制定计划、使用浏览器和终端、连续执行多步任务。Anthropic 称其整体能力已接近 Opus 4.8,但使用成本更低。

Sonnet 5 已向 Claude 各套餐开放,并成为 Free 和 Pro 套餐的默认模型;Claude Code 和 Claude API 也已可使用,API 模型名称为 claude-sonnet-5

核心变化是“把事做完”

Sonnet 4.6 已经能写代码和调用工具,Sonnet 5 则把重心放到更长的执行链上。官方展示的早期测试场景包括处理真实代码仓库、调试故障、调用多种工具,以及在过程中自行检查结果。

这对编程智能体和业务自动化更有价值:用户真正在意的不是模型能否写出某个函数,而是它能否追踪上下文、遵守项目约定、完成测试,并在中途遇到问题时继续推进。不过,“接近 Opus 4.8”不等于所有任务都达到同一水平,官方的表述是高 effort 设置在部分任务上可以匹配 Opus。

价格降了,账单不一定按比例下降

截至 2026 年 8 月 31 日,Sonnet 5 的介绍期 API 价格为每百万输入 token 2 美元、每百万输出 token 10 美元;之后恢复为 3 美元和 15 美元。同期 Opus 4.8 为 5 美元和 25 美元,因此需要大量工具调用的任务有明显的成本空间。

但 Sonnet 5 换用了新 tokenizer。Anthropic 提醒,同样的输入可能会变成原来约 1.0-1.35 倍的 token,具体取决于内容类型。团队做迁移评估时,应比较一个完整任务的总 token、成功率和人工接管次数,不能只看单价。

谁最值得先升级

如果工作流已经依赖 Claude Code、浏览器搜索、终端命令或长链路自动化,Sonnet 5 值得优先做小规模 A/B 测试。而对普通聊天、短文改写和一次性问答,新模型的价值未必会像智能体场景那么明显。

安全方面,Anthropic 报告称 Sonnet 5 比 Sonnet 4.6 更少出现幻觉和谄媚,对提示词注入的抵抗也有改善;但这些仍是发布方的评估结果。上线前更稳妥的做法,是用团队自己的代码库、权限边界和失败样本复测,再决定是否替换现有模型。

推荐工具

更多