Anthropic、MATS、Anthropic Fellowsのプログラムの研究者たちは、最先端のAIモデルがブロックチェーンスマートコントラクトに及ぼす攻撃能力を評価する最新の研究を発表しました。 チームはSCONE-benchという新しいベンチマークを構築しました。これは2020年から2025年の間に実際に攻撃された405件の契約を含み、リスクを単なる成功率ではなく「盗まれる総額」で定量化しています。 結果は、知識のカットオフ時間後に展開され、その後実際の人によって攻撃された34の契約のうち、Claude Opus 4.5、Claude Sonnet 4.5、GPT-5はシミュレーション環境内で合計19の悪用可能なポイントを発見し、約460万ドルの潜在利益に相当します。
405問すべてで、10モデルが合計207件のケースに対して直接行動攻撃スクリプトを生成し、約5億5,010万ドルの「盗難」をシミュレートしました。 また、Binance Smart Chain上で既知の脆弱性のない最近導入された2,849件のERC-20契約をスクリーニングし、そのうち2件を自動テストし、これまで未公開のゼロデイ脆弱性2件を発見しました。過去の流動性推定に基づく最大利益は約3,694ドルでした。そのうちGPT-5の実験は約3,476ドルのAPIコストを差し引いた後も利益の余地があります。
研究チームは、すべての攻撃は実際のパブリックチェーンに資金を使わず、ローカルなフォークチェーンやコンテナサンドボックスでのみ実行されていることを強調しました。 発見された高リスク契約については、資金救済やリスク警告がセキュリティ組織やホワイトハットとの協力を通じて行われます。 著者は、2025年の契約におけるモデルの「盗まれた量」が過去1年で約1.3か月ごとに倍増しており、AIネットワークの攻撃・防御能力が急速に向上していることを示し、スマートコントラクト監査や防御におけるAIツールの体系的な導入を早急に求めています。
よくある質問
Q: この研究は何をしたのですか?
A: 複数のAIモデルがシミュレーションされたチェーン上のスマートコントラクト脆弱性を自動的に検出・悪用し、盗まれる量に基づいて攻撃能力を測定できるSCONE-benchベンチマークを構築します。
Q: テキストで言及されている460万ドルと5億5,000万ドルは何を意味していますか?
A: 460万ドルは、知識カットオフ後に実際に侵害された契約のモデルの最低利益上限であり、5億5,010万ドルは405件の過去の攻撃事例でシミュレーションされた「盗まれた資金」の総額です。
Q: 本当にパブリックチェーンで本物のお金を盗んだのですか?
A: 研究者は、すべてのテストはローカルのフォークされたチェーンおよびサンドボックス環境で実施されており、実際のブロックチェーン資産に対する攻撃は行われていないと説明しました。
Q: いわゆる「ゼロデイ脆弱性」は、この研究でどのように現れますか?
A: 最近の2849件のBSC契約のシミュレーションテストでは、両モデルともこれまで知られていなかった脆弱性を発見し、過去の流動性に基づいて数千ドルの利益を得る完全な攻撃経路を示しました。
Q: この作業はスマートコントラクト開発者や防御者にとってどのような実用的価値がありますか?
A: チームはベンチマークや評価フレームワークを開放し、開発者が契約の「レッドチーミング」を実施できるよう支援し、AI攻撃者に悪用される可能性のある脆弱性を事前に特定・修正する計画です。