Am 4. November 2025 veröffentlichte Anthropic einen Blogbeitrag, in dem vorgeschlagen wird, den Pfad der Codeausführung innerhalb des MCP-Ökosystems (Model Context Protocol) zu priorisieren: Auf jedem MCP-Server werden aufrufbare Code-APIs für Tools generiert. Dadurch können Proxys zuerst Code schreiben und anschließend die Tools aufrufen, anstatt alle Tool-Definitionen und Zwischenergebnisse im Kontext zu speichern. Der Beitrag beschreibt die Generierung von TypeScript-Dateistrukturen pro Server/Tool. Proxys lesen die benötigten Schnittstellen bei Bedarf, filtern und führen Daten in der Ausführungsumgebung zusammen und senden nur die notwendigen Zusammenfassungen an das Modell zurück. Offizielle Beispiele zeigen, dass der Kontextverbrauch von ca. 150.000 Token auf ca. 2.000 reduziert werden kann, was Kosten und Latenz deutlich senkt. Der Beitrag verweist außerdem auf Cloudflares Beobachtung zum „Code-Modus“, die auf denselben Ansatz hindeutet.
Der Artikel hebt die zusätzlichen Vorteile dieser Methode hervor: die Behandlung von Schleifen, Bedingungen und Fehlern in der Ausführungsumgebung; die Anonymisierung personenbezogener Daten in einer lokalen Sandbox-Umgebung, um zu verhindern, dass sensible Informationen in den Modellkontext gelangen; und die Kombination mit der Dateisystempersistenz von Zwischenprodukten sowie die Integration in den wiederverwendbaren „Skills“-Mechanismus von Claude Skills. Die Codeausführung erfordert jedoch eine zuverlässige Sandbox, Quoten und Überwachung, was neue betriebliche und sicherheitstechnische Anforderungen mit sich bringt und somit einen Kompromiss zwischen Effizienz und Risikokontrolle notwendig macht.
Häufig gestellte Fragen
F: Was ist die Kernaussage dieser Veröffentlichung?
A: Verwenden Sie die Codeausführung, um eine Verbindung zu MCP herzustellen: Ordnen Sie das Tool der Code-API zu, laden Sie Definitionen bei Bedarf, verarbeiten Sie Daten in der Ausführungsumgebung und senden Sie dann die Ergebniszusammenfassung zurück an das Modell, wodurch die Kontextnutzung und die Fehlerrate reduziert werden.
F: Wie schneidet es im Vergleich zur Effizienz des „Modell-Direktverbindungstools“ ab?
A: Das offizielle Beispiel zeigt einen Vergleich der Reduzierung der Tokenanzahl von etwa 150.000 auf etwa 2.000, was einer Einsparung von etwa 98,7 % entspricht; die konkreten Vorteile hängen vom Umfang des Tools und der Datenmenge ab.
F: In welchem Zusammenhang steht dies mit dem „Code-Modus“ von Cloudflare?
A: Beide Standpunkte stimmen darin überein: Es ist effizienter, Modellen zu ermöglichen, Code zum Aufrufen abstrakter APIs zu schreiben. Anthropic zitiert diese Vorgehensweise direkt in seinem Artikel.
F: Welche Verbesserungen wurden in Bezug auf Datenschutz und Compliance vorgenommen?
A: Zwischenspeicherdaten verbleiben standardmäßig in der Ausführungsumgebung. Sensible Felder wie E-Mail-Adressen und Telefonnummern können tokenisiert und clientseitig wiederhergestellt werden, wenn Daten zwischen verschiedenen Tools übertragen werden. Dadurch wird die Angriffsfläche für Datenlecks verringert.
F: Wie funktioniert es in Verbindung mit Claude Skills?
A: Der Agent kann verifizierte Skripte als wiederverwendbare Skills (einschließlich SKILL.md und Ressourcen) speichern, auf die in nachfolgenden Aufgaben direkt verwiesen werden kann, was die Robustheit und Wartbarkeit verbessert.