Retour à Questions et réponses sur l’IA
Que dois-je faire si l’agent ou l’objectif d’Hermès tourne mal ? Notez clairement les critères de réussite

Que dois-je faire si l’agent ou l’objectif d’Hermès tourne mal ? Notez clairement les critères de réussite

Questions et réponses sur l’IA Admin 68 vues

La /goal de l’Agent d’Hermès n’est généralement pas un échec de la commande elle-même, mais plutôt que la cible est trop écrite comme un vœu et a trop peu de critères d’acceptation. La bonne approche consiste à noter le produit final, les conditions d’achèvement, les actions interdites et les méthodes d’inspection, puis d’utiliser /subgoal pour compléter les nouvelles exigences en viabilité.

/goal est un mécanisme utilisé par Hermes Agent pour verrouiller des objectifs à long terme, officiellement appelé la capacité de permettre à l’agent de maintenir des cibles sur plusieurs tours dans la version 0.13, et la v0.14 ajoute une /subgoal pour ajouter des conditions de réussite aux cibles en cours. Il convient à la tâche de « continuer à progresser jusqu’à ce que la norme soit atteinte », et ne convient pas à une instruction vague en une seule phrase.

Quel type d’objectif est facile à dévier

  • Écrivez seulement « aidez-moi à optimiser le projet », et ne dites pas quelle partie optimiser.
  • Écrivez seulement « corriger l’erreur », et ne donnez pas l’ordre de reproduction ni les critères de réussite.
  • Il est autorisé à effectuer des modifications majeures librement, mais il n’y a aucune restriction pour ne pas modifier la base de données, la configuration et les dépendances.
  • Qu’il soit étudié et réalisé sans qu’il soit nécessaire de rapporter le plan en premier.

Ce type d’objectifs incitera l’agent Hermès à chercher des emplois « potentiellement utiles » qui finissent par paraître assidus et s’écarter de ce que vous souhaitez réellement.

Écriture plus stable

/goal peuvent être rédigés en quatre paragraphes : objectif, portée, acceptation et limite. Par exemple : corriger l’incapacité à répondre du bouton de la page de connexion ; Seuls les formulaires front-end et les couches d’appels API sont autorisés à être modifiés. Vérifiez avec npm test et une connexion manuelle ; Ne modifiez pas le schéma de la base de données et ne mettez pas à jour les dépendances. Ainsi, l’agent d’Hermès a moins de marge de manœuvre et la probabilité de déviation sera beaucoup plus faible.

Si une nouvelle condition est découverte au milieu de la tâche, ne rouvrez pas une longue tâche, mais complétez-la directement avec /subgoal, par exemple : « Condition supplémentaire : largeur de 375px sur le terminal mobile ne peut pas apparaître en défilement horizontal ». C’est plus stable qu’un simple rappel dans le chat, car cela entre dans le jugement de la cible actuelle.

Quand ne pas utiliser /but

Si vous posez simplement une question de concept, changez la configuration d’une ligne et générez un texte, une conversation normale suffit. /goal Adapté aux tâches longues avec des terminaux clairs : corriger des bugs, nettoyer un lot de fichiers, effectuer une migration et lancer des tests en vert. L’adresse officielle du dépôt est https://github.com/NousResearch/hermes-agent, et il est recommandé de se référer à la description de la version concernant les fonctionnalités de la version.

Outils Recommandés

Plus