Anthropische Methodik: Verwenden Sie Claude, um "richtig" statt "viele" in das Agenten-Tool zu schreiben

Anthropic veröffentlicht eine Engineering-Methodik: Entwerfen, bewerten und iterieren Sie Tools mit KI-Agenten wie Claude. Der Schwerpunkt liegt auf MCP-Tools, systematischer Auswertung und Beschreibungsoptimierung, damit Agenten weniger Umwege gehen, weniger Token verbrauchen und mehr erledigen können.

1. Fazit zuerst: Fünf eiserne Regeln für gute Tools

1. Wählen Sie das Richtige statt Lange

KI-Agenten sind keine Entwickler, und redundante Tools lenken ab. Entwerfen Sie eine kleine Anzahl hochwertiger Tools für hochwertige Workflows, z. B. das Ersetzen generischer Listen durch Suchtypen, um die Aufgabenabsicht direkt mit überprüfbaren Ergebnissen in Einklang zu bringen.

2. Klare Benennung und Namensraum Namespacing

nach Service- und Ressourcenpräfixen, um Überlappungen und Missbrauch von Tool-Funktionen zu reduzieren. Verschiedene Modelle weisen eine unterschiedliche Empfindlichkeit gegenüber der Benennung von Präfixen und Suffixen auf, und die Auswertungsdaten müssen verwendet werden, um das Schema zu bestimmen.

3. Zurückgeben des Kontexts der "Signalisierung"

Die Priorität wird an Schlüsselinformationen und semantische Identifikatoren zurückgegeben, die nachfolgende Aktionen steuern können, und an weniger Felder mit niedrigem Wert. Stellen Sie bei Bedarf detaillierte und optimierte response_format bereit, unter Berücksichtigung von Lesbarkeit und Verkettungsfähigkeiten.

4. Entwickelt für Tokeneffizienz

Paginierung, Filterung und Kürzung sind standardmäßig aktiviert, und in der Fehlermeldung werden umsetzbare Verbesserungsrichtlinien angegeben, um ungültige Wiederholungen und Kontextverschwendung zu vermeiden.

5. Verwenden Sie die "Werkzeugbeschreibung" als Aufforderungsprojekt

Die Ein- und Ausgabe sollte eindeutig sein, und die Beispiele sollten nah am realen Geschäft sein. Kleine Anpassungen an der Beschreibung können die Erfolgsrate und den Abschluss von Toolaufrufen erheblich verbessern.

2. Implementierung: Prototyp → Evaluierung → geschlossener Kreislauf der Co-Creation

1. Erstellen Sie zuerst einen Prototyp und stellen Sie dann eine Verbindung mit MCP

her Verwenden Sie Claude Code, um die minimal verfügbaren Tools und Dokumente zu entwerfen, den lokalen MCP-Server oder die Desktop-Erweiterung zu kapseln, den Closed-Loop-Selbsttest im Agenten zu testen und dann auf die API für programmgesteuerte Experimente zuzugreifen.

2. Systematische Bewertung

: Verwenden Sie

reale Daten und komplexe Aufgaben, um Bewertungssätze zu erstellen, lassen Sie Agenten eine vollständige Tool-Anrufschleife ausführen, erfassen Sie Zeit, Anzahl der Anrufe, Token-Verbrauch und Fehlerarten und unterstützen Sie die Entscheidungsfindung mit mehrdimensionalen Indikatoren außer der Genauigkeit.

3. Arbeiten Sie mit Agenten zusammen, um

Transkriptionen und Fehlerproben zur Analyse an Claude auszuwerten und Tool-Implementierungen und -Erklärungen in Batches zu verbessern, um zu verhindern, dass neue Änderungen die Konsistenz beeinträchtigen. Stellen Sie sicher, dass die Anpassung nicht auf den festgelegten Satz des Satzes des linken Tests beschränkt ist.

3. Betriebsliste des Ingenieurs

(1) Entwerfen Sie

Tools mit einem einzigen Zweck, klarer Eingabebenennung, überprüfbarer Ausgabe und vorrangiger Wiederverwendung der Identifizierung natürlicher Sprache.

(2) Leistung

Begrenzen Sie die Obergrenze der Reaktion des Tools, indem Sie mehreren genauen Abrufen Vorrang vor einem großen Paket einräumen.

(3) Beobachtbare

Tool-Anrufprotokolle, Fehlergründe und kontextbezogene Zusammenfassungen werden für eine einfache Regression aufbewahrt.

(4) Sicherheit

: Unterscheiden Sie zwischen schreibgeschützten und schreibgeschützten Tools, markieren Sie potenziell destruktive Vorgänge und richten Sie eine manuelle Zugriffskontrolle ein.

Häufig gestellte Fragen (Q&A)

F: Wie bringe ich KI-Agenten dazu, meine Tools mehr zu nutzen? A

: Beginnen Sie mit der Werkzeugbeschreibung und geben Sie reale Szenariobeispiele und Parametereinschränkungen an; Verwenden Sie Auswertungsdaten, um die Struktur iterativ zu benennen und auszugeben, und geben Sie bei Bedarf detaillierte und prägnante Rückgaben an, wobei sowohl die Lesbarkeit als auch die Verkettung berücksichtigt werden.

F: Was ist der tatsächliche Wert von MCP für Agenten auf Unternehmensebene

? A: MCP vereinheitlicht den Zugriff auf mehrere Server und mehrere Tools, erleichtert die Namespace-Verwaltung und Berechtigungshierarchie und ermöglicht es Agenten, Hunderte von Tools kontinuierlich und ohne Verwirrung aufzurufen.

F: Was soll ich tun, wenn die Token-Kosten außer Kontrolle geraten sind

A: Paginierung und Filterung auf der Werkzeugebene, Festlegen der Obergrenze für die Anzahl der Antwortwörter und Optimieren des Schreibens von Fehlertexten; Leiten Sie den Agent an, eine große Suche durch mehrere kleine Suchen zu ersetzen.

F: So bewerten Sie, ob das Tool wirklich besser geworden ist

: Legen Sie einen Aufgabensatz und einen Setsatz fest, der dem Unternehmen nahe kommt, und notieren Sie die Genauigkeit, die Anzahl der Anrufe, die verbrauchte Zeit und die Token. Verbesserte Erledigung realer und komplexer Aufgaben vor und nach der Änderung.

Verwandte Artikel

Qwen3-Next-80B-A3B wird eingeführt: 3B-aktiviertes Ultra-Sparse-MoE, ein neuer Maßstab für Long-Context-Durchsatz

checkpoint-engine Open Source: "In-Place Weight Update" auf der LLM-Inferenzseite, wodurch der RL-Trainings-Startzyklus auf die zweite Ebene reduziert wird

Kimi K3 wurde offiziell gestartet: 2,8 Billionen Parameter mit Einsatz auf Millionen von Kontexten und offenem Gewicht

Mistral Studio fügt Prompt-Versionsmanagement hinzu: Enterprise AI verwaltet jetzt Verhaltensressourcen

Empfohlene Tools