Hermes Agent 里 MiniMax Vision 报错,先确认你用的不是“只会文本”的模型。官方 Vision 和 Configuration 文档都强调:图片分析必须走支持 multimodal 的模型,如果把 auxiliary.vision.provider 设成 main,那你的主模型也必须真的支持图像输入。
最快排查
- 先换一个确认支持视觉的模型测试,比如 Codex OAuth 或 OpenRouter 上的视觉模型。
- 检查
auxiliary.vision.provider和auxiliary.vision.model是否指向了错误模型。 - 如果用自定义 endpoint,确认它真的接受 OpenAI 风格的 image content block。
MCP 的 understand_image 会自动接管吗
不要这样理解。Hermes 原生 vision / browser_vision 走的是自己的辅助模型配置,不会因为某个 MCP server 有 understand_image 就自动替换底层视觉模型。
一句话:MiniMax Vision 失败,先查辅助视觉模型是否真的可用,而不是只看 provider 名字。
官方开源地址:https://github.com/NousResearch/hermes-agent;官方文档入口:https://hermes-agent.nousresearch.com/。