Hermes Agent reagiert nach der Verbindung mit Open WebUI nicht mehr auf das Hochladen von Dateien, also wirf nicht zuerst das Frontend weg. Die offizielle API-Server-Dokumentation wurde recht unverblümt formuliert: Dateihochladungen über die API werden derzeit nicht unterstützt. Mit anderen Worten: Selbst wenn es einen Upload-Button im Frontend gibt, kann das Hermes Agent-Backend die hochgeladenen Dokumente oder Bilder nicht als API-Dateieingaben verarbeiten.
Was bedeutet das?
Wenn Sie Dokumentenanalyse, Bildverständnis und Anhänge-Q&A durchführen möchten, ist der zuverlässigste Weg nicht, die Open WebUI weiter zu verändern, sondern den Pfad zu ändern:
- Leg die Datei in ein lokales Verzeichnis, auf das Hermes Agent zugreifen kann, und lass sie mit dem Datei-/Terminal-Tool lesen.
- Oder nutze stattdessen das CLI-/Gateway-Szenario und betritt die Sitzung mit der nativen Anschlussfunktion der Plattform.
- Oder man extrahiert den Inhalt der Datei in Text und sendet eine Textnachricht über die API.
Wann ist kein Problem
Wenn du Anhänge in Telegram, Discord, Slack, E-Mail und anderen Gateways hochlädst, bedeutet das, dass Hermes selbst nicht defekt ist und die Einschränkungen nur auf API-Server-Ebene gelten. Denk nicht an "Gateway-Supportdatei" und "OpenAI-kompatible API-Supportdatei" als dasselbe.
Die Antwort auf diese Frage ist also eigentlich sehr kurz: Es liegt nicht daran, dass die Open WebUI nicht übereinstimmt, sondern dass der Hermes Agent API-Server die Datei noch nicht hochgeladen hat. Kurzfristig ist es zeitsparender, zum lokalen Dateipfad oder zur Textextraktion zu gehen, als weiterhin den Frontend-Upload-Button zu schneiden.
Offizielle Open-Source-Adresse: https://github.com/NousResearch/hermes-agent; Offizieller Dokumenteneintrag: https://hermes-agent.nousresearch.com/.