Der Multi-Round-Dialog der Hermes Agent API ist immer wie "Amnesie", oft liegt es nicht daran, dass das Modell dumm ist, sondern daran, dass du die falsche Schnittstelle angeschlossen hast. Die offizielle API-Server-Dokumentation besagt klar, dass /v1/chat/completions eine zustandslose Schnittstelle ist und der gesamte Kontext jedes Mal vom Client selbst über messages gebracht werden muss.
Die häufigsten Missverständnisse
Viele Front-End können beim ersten Mal normal mit einem Satz antworten, aber in der zweiten Runde senden sie nur einen "Fortsetzen"-Satz, und der Hermes-Agent scheint den vorherigen Satz vergessen zu haben. Es ist nicht so, dass es nicht gespeichert wird, sondern dass du den Chat Completions-Pfad aufrufst, der deine Sitzungen nicht automatisch schützt.
Wie man repariert
- Wenn du
/v1/chat/completionsweiterhin benutzt, nimm jedes Mal die vollständige Nachrichtenhistorie mit. - Wenn du möchtest, dass der Server den Kontext für dich erfasst, ändere ihn auf
/v1/responses. - Missverstehen Sie "OpenAI-kompatibel" nicht als "der Server speichert automatisch alle Multi-Runden-Zustände".
Mit einem Wort: Mehrere Runden mit totalen Breaks sind nicht unbedingt auf Fehler der Hermes Agents zurückzuführen, überprüfe zuerst, ob du noch stateless Chat Completions verwendest.
Offizielle Open-Source-Adresse: https://github.com/NousResearch/hermes-agent; Offizieller Dokumenteneintrag: https://hermes-agent.nousresearch.com/.