Anthropic 发布新一代模型 Claude Sonnet 4.5,官方宣称其为“全球最佳编码模型”,在构建复杂智能体与计算机操作方面居于领先,并在推理与数学评测上取得显著提升。多家媒体与合作方披露,Sonnet 4.5 在真实工程任务中可连续自主工作约 30 小时,较前代显著增长,且在 SWE-Bench 等基准表现出色。
生态层面,Sonnet 4.5 正向企业与开发工具铺开:已接入 AWS Bedrock、GitHub Copilot 公测通道,并在 Claude Code 与 IDE/CLI 等界面提供模型选择。官方称其在安全与对抗方面也做了加固,旨在面向生产环境的长期稳定使用。
常见问题
Q:Claude Sonnet 4.5 的核心看点是什么?
A:定位生产级编码与复杂 Agent,强调“会用电脑”的工具编排与长时自主执行,并提升推理/数学表现。
Q:是否有实证数据?
A:官方与媒体报道提到可连续自主编码约 30 小时,并在 SWE-Bench 等基准上刷新成绩。
Q:哪里可以使用?
A:已在 Anthropic 自家产品上线,并进入 AWS Bedrock、GitHub Copilot 公测与集成。
Q:与前一代相比的提升?
A:长时自主运行从约 7 小时提升到约 30 小时,工具调用与电脑操作、对抗鲁棒性同步加强。
Q:适合哪些场景?
A:大型代码库维护、端到端应用搭建、复杂数据处理与企业级自动化代理。