Retour à Informations sur l’IA
Anthropic lance la pratique « Exécuter du code avec MCP » : permettre aux agents d’améliorer leur efficacité en écrivant du code plutôt qu’en se connectant directement aux outils.

Anthropic lance la pratique « Exécuter du code avec MCP » : permettre aux agents d’améliorer leur efficacité en écrivant du code plutôt qu’en se connectant directement aux outils.

Informations sur l’IA Admin 113 vues

Le 4 novembre 2025, Anthropic a publié un article de blog technique proposant de privilégier l'exécution du code au sein de l'écosystème MCP (Model Context Protocol) : générer des API de code appelables pour les outils sur chaque serveur MCP, permettant ainsi aux proxys d'écrire d'abord le code puis d'appeler les outils, plutôt que de surcharger le contexte avec toutes les définitions d'outils et les résultats intermédiaires. L'article décrit la génération d'arborescences de fichiers TypeScript par serveur/outil, les proxys lisant les interfaces requises à la demande, filtrant et fusionnant les données dans l'environnement d'exécution, et ne renvoyant au modèle que les résumés nécessaires. Des exemples officiels montrent que la consommation de contexte d'environ 150 000 jetons peut être réduite à environ 2 000, diminuant considérablement les coûts et la latence. L'article cite également l'observation de Cloudflare concernant le « Code Mode », qui préconise la même approche.

L'article souligne les avantages supplémentaires de cette méthode : la gestion des boucles, des conditions et des erreurs via l'environnement d'exécution ; l'anonymisation des données personnelles dans un environnement local/sandbox afin d'empêcher l'intégration d'informations sensibles dans le contexte du modèle ; et son association avec la persistance des artefacts intermédiaires sur le système de fichiers, tout en s'intégrant au mécanisme de « compétences » réutilisables de Claude Skills. Cependant, l'exécution de code requiert un sandbox fiable, des quotas et une surveillance, ce qui introduit de nouvelles exigences opérationnelles et de sécurité, et implique un compromis entre efficacité et maîtrise des risques.

Foire aux questions

Q : Quel est le message principal de ce communiqué ?

A : Utilisez l'exécution de code pour vous connecter à MCP : mappez l'outil à l'API de code, chargez les définitions à la demande, traitez les données dans l'environnement d'exécution, puis renvoyez le résumé des résultats au modèle, réduisant ainsi l'utilisation du contexte et le taux d'erreur.

Q : Comment son efficacité se compare-t-elle à celle de l'« outil de connexion directe au modèle » ?

A : L'exemple officiel montre une comparaison entre la réduction du nombre de jetons d'environ 150 000 à environ 2 000, ce qui représente une économie d'environ 98,7 % ; les avantages spécifiques dépendent de l'échelle de l'outil et de la quantité de données.

Q : Quel est le lien entre cela et le « mode code » de Cloudflare ?

A : Les deux points de vue convergent : permettre aux modèles d'écrire du code pour appeler des API abstraites est plus efficace. Anthropic cite d'ailleurs directement cette pratique dans son article.

Q : Quelles améliorations ont été apportées en matière de confidentialité et de conformité ?

A : Par défaut, les données intermédiaires restent dans l'environnement d'exécution. Les champs sensibles, tels que les adresses électroniques et les numéros de téléphone, peuvent être tokenisés et restaurés côté client lors du transfert de données entre outils, ce qui réduit les risques de fuite.

Q : Comment cela fonctionne-t-il en association avec Claude Skills ?

A : L'agent peut enregistrer des scripts vérifiés en tant que compétences réutilisables (y compris SKILL.md et les ressources), qui peuvent être directement référencées dans les tâches suivantes, améliorant ainsi la robustesse et la maintenabilité.

stratégie de priorité d'exécution du code de l'écosystème MCP Outils de mappage vers des API de code appelables Le proxy écrit d'abord le code, puis appelle le flux d'outils. Arborescence de fichiers TypeScript générée par le serveur Charger les interfaces à la demande pour réduire la redondance du contexte. L'environnement d'exécution fusionne et filtre les données intermédiaires Nombre de contextes réduit de 150 000 à 2 000 (exemple) Explication des économies réalisées grâce aux jetons (environ 98,7 %) Comparaison des outils de connexion directe de modèles et du mode de code L'approche de CloudflareCodeMode est cohérente Gestion des boucles et des branches défectueuses dans un environnement de test L’étiquetage d’anonymisation des données est effectué au niveau de la couche d’exécution locale. Tokenisation des champs sensibles pour prévenir les fuites Ne renvoyez au modèle que le résumé des résultats nécessaires. intermédiaires de persistance du système de fichiers Intégration avec les mécanismes de compétences de ClaudeSkills Les scripts ont été vérifiés et peuvent être utilisés comme compétences réutilisables. Meilleures pratiques en matière de compétences et d'organisation des ressources L'exécution du code nécessite des quotas et une gouvernance de surveillance. Le compromis entre les gains d'efficacité et les coûts de contrôle des risques Couche API abstraite pour les grands ensembles d'outils Récupération côté client du flux de données inter-outils Réduire le risque de surcharge contextuelle de la définition des outils Améliorer la stabilité et la reproductibilité du raisonnement Serveur distant MCP combiné à des appels de code Lecture de la définition d'interface pilotée par les tâches par module Conditions de prise en charge de l'environnement d'exécution et mécanisme de nouvelle tentative Gestion conforme de la confidentialité au sein du bac à sable du domaine privé Les chaînes d'outils multi-étapes sont exécutées via l'orchestration du code. Comment les développeurs peuvent créer une couche de sécurité sandbox Référentiel de scripts auditable pour les équipes Contrôle d'exécution combinant permissions et quotas Chemin pour connecter les API cloud et les bases de données Paradigme de génération de résumés de contexte minimal Réduire la mauvaise utilisation des modèles et les surfaces d'injection d'illusions Les modèles basés sur le code réduisent la latence et les coûts supplémentaires. Compromis liés à l'approche d'empilement de matériaux DeepContext Conformité et facilité d'audit pour les entreprises Exécution des scripts d'agent dans le pipeline CI TypeGen génère automatiquement des définitions de types d'interface. Les modifications d'interface sont gérées par le biais du versionnage. Optimisez le nombre d'appels en combinant la mise en cache et la déduplication Pratiques d'encapsulation d'API pour plusieurs langues Lien en boucle fermée de la tâche au code jusqu'au résultat Conception pour la reprise de l'exécution après les points d'arrêt dans les tâches de longue durée Révision et signature du scénario pour la collaboration d'équipe Standardisation du répertoire d'outils et de l'ordre de chargement Modèle de classification des erreurs et de stratégie de récupération Principe de priorité locale pour les scénarios hautement sensibles Architecture en couches pour l'exécution de code et l'invocation de modèles

Outils Recommandés

Plus