Wenn Sie ein Modell für Hermes Agent auswählen, schauen Sie nicht nur auf den Listenscore. Das Wichtigste sind drei Dinge: ob der Toolaufruf stabil ist, ob der Kontext lang genug ist und ob Ihre Aufgabe darin besteht, Code zu schreiben, zu recherchieren oder tägliche Aufgaben zu automatisieren. Modelle sind intelligent, stabilisieren aber keine Werkzeuge und können in Agentenszenarien schwer einzusetzen sein.
Das Mastermodell priorisiert die Fähigkeiten der Werkzeuge
Der Wert von Hermes liegt in seiner Fähigkeit, Werkzeuge wie Terminals, Dateien, Webseiten, MCPs, Messaging-Plattformen usw. aufzurufen. Das Mastermodell muss in der Lage sein, Werkzeugaufrufe korrekt auszugeben und nach den Ergebnissen des Tools weiterhin zu argumentieren. Viele Fälle von "es chatet nur und funktioniert nicht" hängen letztlich mit der Modellkompatibilität zusammen.
Lange Aufgaben hängen ebenfalls vom Kontext ab
Wenn Sie Hermes oft bitten, Projekte zu lesen, lange Sitzungen zu führen oder mehrstufige Recherchen durchzuführen, sollte der Modellkontext nicht zu klein sein. Die offizielle Konfiguration erinnert außerdem daran, dass das für die Kompression verwendete Zusammenfassungsmodell ein Kontextfenster nicht niedriger als das Hauptmodell haben sollte, andernfalls kann der Kompressionsaufruf scheitern oder sogar dazu führen, dass der Zwischenkontext verloren geht.
Praktische Auswahlratschläge
- Code-Korrektur: Wählen Sie ein Werkzeug aus, um ein stabiles, langkontextiertes Modell aufzurufen.
- Alltägliche Fragen und leichte Aufgaben: Günstigere Mini- oder Flash-Modelle sind erhältlich.
- Lokales Modell: Stellen Sie sicher, dass OpenAI mit der Benutzeroberfläche und dem Tool-Anrufformat kompatibel ist, nicht nur mit dem Chat.
- Zusatzaufgaben wie Kompression, Titel und Vision: Konfigurieren Sie das Hilfsmodell separat und verwenden Sie nicht standardmäßig das teuerste Hauptmodell.
Die zuverlässigste Methode zum Testen ist, Hermes eine kleine echte Aufgabe erledigen zu lassen: eine Datei lesen, eine Zeile ändern, einen Befehl ausführen und die Ergebnisse zusammenfassen. Wenn du diese Kette abschließen kannst, solltest du sie als tägliches Mastermodell einrichten.