Anthropicは、次世代モデルであるClaude Sonnet 4.5をリリースしました。これは「世界最高のコーディングモデル」と公式に謳われ、複雑なインテリジェントエージェントやコンピュータ操作の構築をリードし、推論能力と数学的評価において大幅な改善を実現しています。複数のメディアやパートナー企業によると、Sonnet 4.5は実世界のエンジニアリングタスクにおいて約30時間の自律動作が可能で、前世代機と比べて大幅に向上しています。また、SWE-Benchなどのベンチマークテストでも非常に優れたパフォーマンスを発揮しています。
エコシステム面では、Sonnet 4.5がエンタープライズおよび開発ツール向けに展開されています。AWS BedrockおよびGitHub Copilotのパブリックベータチャネルに統合され、Claude CodeやIDE/CLIなどのインターフェースでモデル選択機能を提供します。また、セキュリティと敵対的攻撃に対する耐性も強化されており、本番環境での長期安定的な利用を目指していると、関係者は述べています。
よくある質問
Q: Claude Sonnet 4.5 の最大の魅力は何ですか?
A: 実稼働レベルのコーディングと複雑なエージェントを対象とし、「コンピュータに精通した」ツールのオーケストレーションと長期的な自律実行を重視し、推論/数学的パフォーマンスを向上させます。
Q: 実証的なデータはありますか?
A: 公式レポートやメディアの報道によると、約 30 時間連続して独立してコーディングでき、SWE-Bench などのベンチマークで新しいスコアを樹立できるとのことです。
Q: どこで使えますか?
A: Anthropic 独自の製品でリリースされており、パブリックベータ版に移行し、 AWS BedrockとGitHub Copilotとの統合も開始されています。
Q: 前世代と比べてどのような点が改善されましたか?
A: 長時間自律運転が約7時間から約30時間に延長され、ツール呼び出し、コンピュータ操作、反堅牢性も同時に強化されました。
Q: どのようなシナリオに適していますか?
A: 大規模なコードベースのメンテナンス、エンドツーエンドのアプリケーション構築、複雑なデータ処理、エンタープライズレベルの自動化エージェント。