Des chercheurs des programmes Anthropic, MATS et Anthropic Fellows ont publié leurs dernières recherches évaluant les capacités d’attaque des modèles d’IA de pointe sur les smart contracts blockchain. L’équipe a créé un nouveau benchmark appelé SCONE-bench, qui comprend 405 contrats qui ont été réellement attaqués entre 2020 et 2025, et quantifie le risque en termes de « montant total d’argent pouvant être volé » plutôt qu’en un simple taux de réussite. Les résultats montrent que parmi les 34 contrats déployés après le délai de coupure des connaissances et attaqués par la suite par de vraies personnes, Claude Opus 4.5, Claude Sonnet 4.5 et GPT-5 ont trouvé un total de 19 points exploitables dans l’environnement simulé, correspondant à un profit potentiel d’environ 4,6 millions de dollars.
Surles 405 questions de benchmark, 10 modèles ont généré ensemble des scripts d’attaque direct-to-action pour 207 cas, simulant le « vol » d’environ 550,1 millions de dollars. L’étude a également filtré 2 849 contrats ERC-20 récemment déployés sans vulnérabilités connues sur la Binance Smart Chain, a automatisé les tests de deux d’entre eux, et a révélé deux vulnérabilités zero-day non divulguées auparavant, avec un bénéfice maximal d’environ 3 694 $ basé sur des estimations historiques de liquidité, dont une expérience avec GPT-5 laisse encore des marges de profit après avoir déduit environ 3 476 $ de coûts d’API.
L’équipe de recherche a souligné que toutes les attaques n’étaient menées que dans des chaînes fourchues locales et des bacs à sable à conteneurs, sans utiliser de fonds pour de véritables chaînes publiques. Pour les contrats à haut risque découverts, le sauvetage de fonds ou l’alerte aux risques est réalisé par la coopération avec des organisations de sécurité et des « white hats ». L’auteur a souligné que le « montant volé » du modèle sur les contrats de 2025 a environ doublé tous les 1,3 mois au cours de l’année écoulée, indiquant que les capacités offensives et défensives des réseaux d’IA s’améliorent rapidement, et a appelé à l’adoption systématique des outils d’IA dans l’audit et la défense des contrats intelligents dès que possible.
FAQ
Q : Que faisait l’étude ?
R : Construire un benchmark SCONE-bench permettant à plusieurs modèles d’IA de détecter et exploiter automatiquement les vulnérabilités des contrats intelligents sur des chaînes simulées, et de mesurer les capacités d’attaque en fonction de la quantité pouvant être volée.
Q : Que représentent les 4,6 et 550 millions de dollars mentionnés dans le texte ?
R : 4,6 millions de dollars est la limite minimale de profit potentiel pour le modèle sur les contrats effectivement compromis après la coupure des connaissances, et 550,1 millions de dollars est le montant total des « fonds volés » simulés sur 405 cas d’attaques historiques.
Q : Avez-vous vraiment volé de l’argent réel sur la chaîne publique ?
R : Le chercheur a expliqué que tous les tests ont été réalisés dans l’environnement local forked chain et sandbox, et qu’aucune attaque n’a été menée contre de réels actifs blockchain.
Q : Comment la soi-disant « vulnérabilité zéro jour » se manifeste-t-elle dans cette étude ?
R : Dans le test de simulation de 2849 contrats BSC récents, les deux modèles ont chacun découvert des vulnérabilités jusque-là inconnues et ont offert une voie d’attaque complète, pouvant générer des milliers de dollars de bénéfices grâce à la liquidité historique.
Q : Quelle est la valeur pratique de ce travail pour les développeurs et défenseurs de contrats intelligents ?
R : L’équipe prévoit d’ouvrir des benchmarks et des cadres d’évaluation pour aider les développeurs à effectuer un « red teaming » automatisé des contrats avant de lancer leur mise en ligne, ainsi qu’à identifier et corriger les failles susceptibles d’être exploitées par les attaquants IA à l’avance.