ヘルメスのエージェントは映像を送信できないので、クリップボードを疑わないでください。 公式のVisionドキュメントはシンプルで、画像はbase64のコンテンツブロックとしてモデルに送られるため、モデル自体が視覚入力をサポートしなければなりません。 現在のマスターモデルがプレーンテキストモデルであったり、補助ビジョンを画像をサポートしないエンドポイントに向けた場合、失敗します。
まずは確認方法
- 画像が正常に貼り付けられたことを確認し、インターフェースで添付プロンプトが表示されます。
- 視力がサポートされていることを確認するプロバイダー検査に変更。
auxiliary.vision.provider、model、base_url設定が誤っているか確認してください。provider: mainを使う場合、マスターモデルもマルチモーダルモデルでなければなりません。
公式設定文書には、Codex OAuthが自動検知チェーンで視覚をサポートしていることも記されています。 カスタムエンドポイントは互換性が保証されなければなりません。
一言で言えば、画像伝送の失敗は主に「画像が貼り付けられていない」という点ではなく、補助視覚モデルが画像をサポートしていないからです。
公式オープンソースアドレス:https://github.com/NousResearch/hermes-agent; 公式文書の記録:https://hermes-agent.nousresearch.com/。