ヘルメスエージェントの画像タスクは認識できません。まずタスクテキストに明確に画像が引用されているか確認してください。 v0.15.1はカンバンワーカーを改善し、視覚機能をサポートするモデルがタスクボディで参照された画像を受信できるようになりました。 重要なポイントは、画像は特定のディレクトリに置くだけでなく、タスクの文脈に含めなければならないということです。
なぜ見落とし画像があるのでしょうか?
「このスクリーンショットを参照」と見た人はどちらのことを指しているか分かるかもしれませんが、作業員は分からないかもしれません。 タスク本体に画像パス、添付説明、文脈参照がなければ、分割後、実際の作業者はテキストのみを受け取り、画像は受け取れないことがあります。
正しい書き方
- タスク本文内の画像経路や添付位置を明確に記載してください。
- レイアウトのずれ、テキストの誤り、チャートの変更など、画像で注意すべき問題を指定してください。
- ワーカーが視覚入力をサポートするモデルを使用しているか確認してください。
- タスクが分割されている場合は、画像を表示する必要があるサブタスクに画像参照を残してください。
ワーカーが倉庫全体の画像を自動的にスキャンすることは期待しないでください。 それは文脈を無駄にし、無関係な内容を簡単に課題に持ち込んでしまいます。
他に調べることはあるのでしょうか?
もし本文がすでに画像を引用しているのに認識できない場合は、その画像がワーカーアクセス可能なワークスペースにあるか確認してください。 Docker、SSH、Modalのようなバックエンドは、「ローカルマシンにはファイルがあるが、リモートワーカーには全くない」という状況に遭遇することがよくあります。 まずファイルを同期し、その後モデルの機能について話し合います。