Zurück zu Fragen und Antworten zu KI
Hermes-Agenten-Bildaufgabe nicht erkannt? Der Haupttext sollte die Referenzen eindeutig anführen

Hermes-Agenten-Bildaufgabe nicht erkannt? Der Haupttext sollte die Referenzen eindeutig anführen

Fragen und Antworten zu KI Admin 2 Aufrufe

Die Bildaufgabe von Hermes Agent kann nicht erkannt werden; prüfen Sie zunächst, ob der Aufgabentext eindeutig Bilder zitiert. v0.15.1 verbesserte den Kanban-Worker, sodass Modelle, die visuelle Fähigkeiten unterstützen, Bilder empfangen konnten, die im Aufgabenkörper referenziert sind. Der entscheidende Punkt ist, dass Bilder im Aufgabenkontext enthalten sein müssen und nicht nur in einem bestimmten Verzeichnis platziert werden müssen.

Warum gibt es übersehene Bilder?

Die Leute wissen vielleicht, welche du meinst, wenn sie "siehe diesen Screenshot" sehen, aber der Mitarbeiter weiß es vielleicht nicht. Wenn der Aufgabenkörper keine Bildpfade, Anhangsbeschreibungen oder Kontextreferenzen enthält, kann der eigentliche Worker nach der Aufteilung der Aufgabe nur den Text und nicht das Bild erhalten.

Wie man es richtig schreibt

  1. Geben Sie im Task Body klar den Bildpfad oder den Anhang an.
  2. Gib an, auf welche Probleme im Bild zu achten ist, wie z. B. Layout-Fehlausrichtung, Textfehler oder Diagrammänderungen.
  3. Bestätigen Sie, dass der Worker ein Modell verwendet, das visuelle Eingaben unterstützt.
  4. Wenn die Aufgabe geteilt ist, behalte Bildreferenzen in der Unteraufgabe, die das Bild anzeigen muss.

Erwarte nicht, dass der Worker automatisch alle Bilder aus dem gesamten Lager scannt. Das verschwendet Kontext und bringt leicht irrelevantes Material in die Aufgabe.

Was gibt es sonst noch zu untersuchen?

Wenn der Haupttext bereits ein Bild zitiert hat, aber dennoch nicht erkannt werden kann, prüfen Sie, ob das Bild im für Arbeiter zugänglichen Arbeitsbereich enthalten ist. Backends wie Docker, SSH und Modal stoßen oft auf Situationen, in denen "die lokale Maschine Dateien hat, aber der Remote-Mitarbeiter keine." Synchronisiere zuerst die Dateien, dann diskutiere die Modellfähigkeiten.

Empfohlene Tools

Mehr