Le 4 novembre 2025, Anthropic a publié un article de blog technique proposant de privilégier l'exécution du code au sein de l'écosystème MCP (Model Context Protocol) : générer des API de code appelables pour les outils sur chaque serveur MCP, permettant ainsi aux proxys d'écrire d'abord le code puis d'appeler les outils, plutôt que de surcharger le contexte avec toutes les définitions d'outils et les résultats intermédiaires. L'article décrit la génération d'arborescences de fichiers TypeScript par serveur/outil, les proxys lisant les interfaces requises à la demande, filtrant et fusionnant les données dans l'environnement d'exécution, et ne renvoyant au modèle que les résumés nécessaires. Des exemples officiels montrent que la consommation de contexte d'environ 150 000 jetons peut être réduite à environ 2 000, diminuant considérablement les coûts et la latence. L'article cite également l'observation de Cloudflare concernant le « Code Mode », qui préconise la même approche.
L'article souligne les avantages supplémentaires de cette méthode : la gestion des boucles, des conditions et des erreurs via l'environnement d'exécution ; l'anonymisation des données personnelles dans un environnement local/sandbox afin d'empêcher l'intégration d'informations sensibles dans le contexte du modèle ; et son association avec la persistance des artefacts intermédiaires sur le système de fichiers, tout en s'intégrant au mécanisme de « compétences » réutilisables de Claude Skills. Cependant, l'exécution de code requiert un sandbox fiable, des quotas et une surveillance, ce qui introduit de nouvelles exigences opérationnelles et de sécurité, et implique un compromis entre efficacité et maîtrise des risques.
Foire aux questions
Q : Quel est le message principal de ce communiqué ?
A : Utilisez l'exécution de code pour vous connecter à MCP : mappez l'outil à l'API de code, chargez les définitions à la demande, traitez les données dans l'environnement d'exécution, puis renvoyez le résumé des résultats au modèle, réduisant ainsi l'utilisation du contexte et le taux d'erreur.
Q : Comment son efficacité se compare-t-elle à celle de l'« outil de connexion directe au modèle » ?
A : L'exemple officiel montre une comparaison entre la réduction du nombre de jetons d'environ 150 000 à environ 2 000, ce qui représente une économie d'environ 98,7 % ; les avantages spécifiques dépendent de l'échelle de l'outil et de la quantité de données.
Q : Quel est le lien entre cela et le « mode code » de Cloudflare ?
A : Les deux points de vue convergent : permettre aux modèles d'écrire du code pour appeler des API abstraites est plus efficace. Anthropic cite d'ailleurs directement cette pratique dans son article.
Q : Quelles améliorations ont été apportées en matière de confidentialité et de conformité ?
A : Par défaut, les données intermédiaires restent dans l'environnement d'exécution. Les champs sensibles, tels que les adresses électroniques et les numéros de téléphone, peuvent être tokenisés et restaurés côté client lors du transfert de données entre outils, ce qui réduit les risques de fuite.
Q : Comment cela fonctionne-t-il en association avec Claude Skills ?
A : L'agent peut enregistrer des scripts vérifiés en tant que compétences réutilisables (y compris SKILL.md et les ressources), qui peuvent être directement référencées dans les tâches suivantes, améliorant ainsi la robustesse et la maintenabilité.