Wenn der MiniMax Vision-Fehler im Hermes Agent gemeldet wird, bestätigen Sie zunächst, dass Sie kein "reiner Text"-Modell verwenden. Die offiziellen Vision- und Konfigurationsdokumente betonen, dass Bildanalyse zu einem Modell gehen muss, das Multimodal unterstützt, und wenn man auxiliary.vision.provider auf main setzt, muss das Hauptmodell auch wirklich Bildeingaben unterstützen.
Die schnellste Untersuchung
- Beginnen Sie damit, ein Modell zu testen, das bestätigt, dass es Vision unterstützt, wie zum Beispiel ein Vision-Modell auf Codex OAuth oder OpenRouter.
- Überprüfe, ob
auxiliary.vision.providerundauxiliary.vision.modelauf das falsche Modell hinweisen. - Wenn du einen benutzerdefinierten Endpunkt verwendest, stelle sicher, dass er tatsächlich OpenAI-ähnliche Bildinhaltsblöcke akzeptiert.
Übernehmen MCPs understand_image automatisch die Kontrolle?
So verstehe ich das nicht. Hermes' natives Vision/browser_vision verwendet eine eigene Hilfsmodellkonfiguration und ersetzt das zugrundeliegende Vision-Modell nicht automatisch, nur weil ein MCP-Server understand_image hat.
Mit einem Wort: Wenn MiniMax Vision ausfällt, prüfen Sie zuerst, ob das zusätzliche Visionsmodell wirklich verfügbar ist, anstatt nur auf den Namen des Anbieters zu schauen.
Offizielle Open-Source-Adresse: https://github.com/NousResearch/hermes-agent; Offizieller Dokumenteneintrag: https://hermes-agent.nousresearch.com/.