Hermes AgentでMiniMax Visionエラーが報告された場合は、まず「テキストのみ」モデルを使っていないことを確認してください。 公式のVisionとConfigurationのドキュメントでは、画像解析はマルチモーダルをサポートするモデルに行わなければならず、auxiliary.vision.providerをmainに設定すれば、メインモデルも画像入力をしっかりサポートしなければならないと強調されています。
最速の調査
- まずは、Codex OAuthやOpenRouterのビジョンモデルなど、ビジョンをサポートするモデルをテストしてください。
auxiliary.vision.providerが間違ったモデルを指auxiliary.vision.modelていないか確認してください。- カスタムエンドポイントを使う場合は、OpenAIスタイルの画像コンテンツブロックを本当に受け入れているか確認してください。
MCPのunderstand_imageは自動的に引き継がれるのでしょうか?
そういう意味じゃない。 Hermesのネイティブビジョン/browser_visionは独自の補助モデル構成を使用しており、MCPサーバーにunderstand_imageがあるからといって基盤となるビジョンモデルを自動的に置き換えるわけではありません。
一言で言えば、MiniMax Visionが失敗した場合は、プロバイダー名だけでなく、まず補助ビジョンモデルが本当に利用可能かどうかを確認してください。
公式オープンソースアドレス:https://github.com/NousResearch/hermes-agent; 公式文書登録:https://hermes-agent.nousresearch.com/。