Retour à Questions et réponses sur l’IA
Tâche d’image de l’agent Hermès ne reconnaît pas ? Le texte principal doit clairement citer les références

Tâche d’image de l’agent Hermès ne reconnaît pas ? Le texte principal doit clairement citer les références

Questions et réponses sur l’IA Admin 2 vues

La tâche image de l’agent Hermès ne peut pas être reconnue ; vérifiez d’abord si le texte de la tâche cite clairement les images. la v0.15.1 a amélioré le travailleur Kanban, permettant aux modèles supportant des capacités visuelles de recevoir les images référencées dans le corps de la tâche. L’essentiel est que les images doivent être incluses dans le contexte de la tâche, et non simplement placées dans un répertoire spécifique.

Pourquoi y a-t-il des images manquées ?

Les gens peuvent savoir de quoi vous parlez quand ils voient « référer cette capture d’écran », mais l’employé ne le sait peut-être pas. Si le corps de la tâche ne contient pas de chemins d’image, de descriptions de pièces jointes ou de références contextuelles, après la séparation de la tâche, le travailleur réel peut ne recevoir que le texte et non l’image.

La bonne façon de l’écrire

  1. Indiquez clairement le chemin de l’image ou l’emplacement de l’annexe dans le corps de la tâche.
  2. Spécifiez quels problèmes surveiller dans l’image, comme un désalignement de la mise en page, des erreurs de texte ou des modifications de schémas.
  3. Confirmez que le Worker utilise un modèle qui prend en charge l’entrée visuelle.
  4. Si la tâche est divisée, conservez les références d’image dans la sous-tâche qui doit visualiser l’image.

Ne vous attendez pas à ce que le Worker scanne automatiquement toutes les images de l’ensemble de l’entrepôt. Cela gaspille le contexte et apporte facilement du matériel hors sujet à la tâche.

Quoi d’autre à enquêter ?

Si le texte principal a déjà cité une image mais ne peut toujours pas être reconnu, vérifiez si l’image se trouve dans l’espace de travail accessible par le travailleur. Les backends comme Docker, SSH et Modal se retrouvent souvent dans des situations où « la machine locale a des fichiers, mais le travailleur à distance n’en a aucun. » Synchronisez d’abord les fichiers, puis discutez des capacités des modèles.

Outils Recommandés

Plus