Zurück zu KI-Informationen
Anthropische Methodik: Verwenden Sie Claude, um "richtig" statt "viele" in das Agenten-Tool zu schreiben

Anthropische Methodik: Verwenden Sie Claude, um "richtig" statt "viele" in das Agenten-Tool zu schreiben

KI-Informationen Admin 35 Aufrufe

Anthropic veröffentlicht eine Engineering-Methodik: Entwerfen, bewerten und iterieren Sie Tools mit KI-Agenten wie Claude. Der Schwerpunkt liegt auf MCP-Tools, systematischer Auswertung und Beschreibungsoptimierung, damit Agenten weniger Umwege gehen, weniger Token verbrauchen und mehr erledigen können.


1. Fazit zuerst: Fünf eiserne Regeln für gute Tools

1. Wählen Sie das Richtige statt Lange

KI-Agenten sind keine Entwickler, und redundante Tools lenken ab. Entwerfen Sie eine kleine Anzahl hochwertiger Tools für hochwertige Workflows, z. B. das Ersetzen generischer Listen durch Suchtypen, um die Aufgabenabsicht direkt mit überprüfbaren Ergebnissen in Einklang zu bringen.

2. Klare Benennung und Namensraum Namespacing

nach Service- und Ressourcenpräfixen, um Überlappungen und Missbrauch von Tool-Funktionen zu reduzieren. Verschiedene Modelle weisen eine unterschiedliche Empfindlichkeit gegenüber der Benennung von Präfixen und Suffixen auf, und die Auswertungsdaten müssen verwendet werden, um das Schema zu bestimmen.

3. Zurückgeben des Kontexts der "Signalisierung"

Die Priorität wird an Schlüsselinformationen und semantische Identifikatoren zurückgegeben, die nachfolgende Aktionen steuern können, und an weniger Felder mit niedrigem Wert. Stellen Sie bei Bedarf detaillierte und optimierte response_format bereit, unter Berücksichtigung von Lesbarkeit und Verkettungsfähigkeiten.

4. Entwickelt für Tokeneffizienz

Paginierung, Filterung und Kürzung sind standardmäßig aktiviert, und in der Fehlermeldung werden umsetzbare Verbesserungsrichtlinien angegeben, um ungültige Wiederholungen und Kontextverschwendung zu vermeiden.

5. Verwenden Sie die "Werkzeugbeschreibung" als Aufforderungsprojekt

Die Ein- und Ausgabe sollte eindeutig sein, und die Beispiele sollten nah am realen Geschäft sein. Kleine Anpassungen an der Beschreibung können die Erfolgsrate und den Abschluss von Toolaufrufen erheblich verbessern.


2. Implementierung: Prototyp → Evaluierung → geschlossener Kreislauf der Co-Creation

1. Erstellen Sie zuerst einen Prototyp und stellen Sie dann eine Verbindung mit MCP

her Verwenden Sie Claude Code, um die minimal verfügbaren Tools und Dokumente zu entwerfen, den lokalen MCP-Server oder die Desktop-Erweiterung zu kapseln, den Closed-Loop-Selbsttest im Agenten zu testen und dann auf die API für programmgesteuerte Experimente zuzugreifen.

2. Systematische Bewertung

: Verwenden Sie

reale Daten und komplexe Aufgaben, um Bewertungssätze zu erstellen, lassen Sie Agenten eine vollständige Tool-Anrufschleife ausführen, erfassen Sie Zeit, Anzahl der Anrufe, Token-Verbrauch und Fehlerarten und unterstützen Sie die Entscheidungsfindung mit mehrdimensionalen Indikatoren außer der Genauigkeit.

3. Arbeiten Sie mit Agenten zusammen, um

Transkriptionen und Fehlerproben zur Analyse an Claude auszuwerten und Tool-Implementierungen und -Erklärungen in Batches zu verbessern, um zu verhindern, dass neue Änderungen die Konsistenz beeinträchtigen. Stellen Sie sicher, dass die Anpassung nicht auf den festgelegten Satz des Satzes des linken Tests beschränkt ist.


3. Betriebsliste des Ingenieurs

(1) Entwerfen Sie

Tools mit einem einzigen Zweck, klarer Eingabebenennung, überprüfbarer Ausgabe und vorrangiger Wiederverwendung der Identifizierung natürlicher Sprache.

(2) Leistung

Begrenzen Sie die Obergrenze der Reaktion des Tools, indem Sie mehreren genauen Abrufen Vorrang vor einem großen Paket einräumen.

(3) Beobachtbare

Tool-Anrufprotokolle, Fehlergründe und kontextbezogene Zusammenfassungen werden für eine einfache Regression aufbewahrt.

(4) Sicherheit

: Unterscheiden Sie zwischen schreibgeschützten und schreibgeschützten Tools, markieren Sie potenziell destruktive Vorgänge und richten Sie eine manuelle Zugriffskontrolle ein.


Häufig gestellte Fragen (Q&A)

F: Wie bringe ich KI-Agenten dazu, meine Tools mehr zu nutzen? A

: Beginnen Sie mit der Werkzeugbeschreibung und geben Sie reale Szenariobeispiele und Parametereinschränkungen an; Verwenden Sie Auswertungsdaten, um die Struktur iterativ zu benennen und auszugeben, und geben Sie bei Bedarf detaillierte und prägnante Rückgaben an, wobei sowohl die Lesbarkeit als auch die Verkettung berücksichtigt werden.

F: Was ist der tatsächliche Wert von MCP für Agenten auf Unternehmensebene

? A: MCP vereinheitlicht den Zugriff auf mehrere Server und mehrere Tools, erleichtert die Namespace-Verwaltung und Berechtigungshierarchie und ermöglicht es Agenten, Hunderte von Tools kontinuierlich und ohne Verwirrung aufzurufen.

F: Was soll ich tun, wenn die Token-Kosten außer Kontrolle geraten sind

?

A: Paginierung und Filterung auf der Werkzeugebene, Festlegen der Obergrenze für die Anzahl der Antwortwörter und Optimieren des Schreibens von Fehlertexten; Leiten Sie den Agent an, eine große Suche durch mehrere kleine Suchen zu ersetzen.

F: So bewerten Sie, ob das Tool wirklich besser geworden ist

A

: Legen Sie einen Aufgabensatz und einen Setsatz fest, der dem Unternehmen nahe kommt, und notieren Sie die Genauigkeit, die Anzahl der Anrufe, die verbrauchte Zeit und die Token. Verbesserte Erledigung realer und komplexer Aufgaben vor und nach der Änderung.

Anthropische Engineering-Methodik Claude fungiert als Agent MCP-Instrumentalisierungsrahmen Design von KI-Agenten-Tools Optimierung der Werkzeugbeschreibung Systematische Evaluationsmethode Geschlossener Regelkreis für die Agentenbewertung Kontrolle der Token-Kosten Richtlinien für die Paginierungsfilterung Namenskonventionen für Namespaces Hochwertige Werkzeugauswahl Gibt einen signalisierten Kontext zurück Detaillierter und stromlinienförmiger Rücklauf mit doppelter Geschwindigkeit Build-Leitfaden für Evaluierungssets Bewertung der realen Aufgabe Metriken für die Anzahl der Anrufe und die verbrachte Zeit Überwachung des Tokenverbrauchs Analyse der Fehlerart Wiedergabe von Fehlerbeispielen Zusammenarbeit und Co-Creation von Agenturen ClaudeCode-Prototyp Lokaler MCP-Server Zugriff auf Desktop-Erweiterungen Programmgesteuerte API-Experimente Werkzeugein- und -ausgaben sind eindeutig Beobachtbarkeitsprotokolle Audit von Tool-Aufrufen Schreibgeschützte und schreibgeschützte Berechtigungen Strategie für die manuelle Zutrittskontrolle Suchbasiertes Tool-Design Liste zur Suchoptimierung Beispiel für Parametereinschränkungen Sensitivitätstests für Namen Multi-Server- und Multi-Tool-Verwaltung Praxis für die Berechtigungshierarchie Vermeidung von Namensraumkonflikten Mehrere kleine Retrieval-Strategien Alternativen für große Rückholungen Erhöhte Aufgabenerledigung Der Satz wird belassen, um zu überprüfen, ob er nicht passt Agenten vermeiden Umwege Weniger Token werden verwendet, um mehr Dinge zu erreichen Werkzeugbau prompt Engineering Evaluierung treibt die Iteration voran Das Unternehmen ist nah an der gestellten Aufgabe Standardisierung der Ausgabestrukturen Antwort\_format Design Wert des MCP Enterprise-Agenten Werkzeugfräsen und -auswahl Hochwertige Workflows werden priorisiert

Empfohlene Tools

Mehr