Hermes 에이전트는 영상을 전송하지 못하니 클립보드를 의심하지 마세요. 공식 Vision 문서는 간단합니다: 이미지는 base64 콘텐츠 블록으로 모델에 전송되므로 모델 자체가 시각적 입력을 지원해야 합니다. 현재 마스터 모델이 평문 모델이거나, 보조 비전을 이미지를 지원하지 않는 엔드포인트를 가리키면 실패합니다.
먼저 확인하는 방법
- 이미지가 성공적으로 붙여넣혔는지 확인하면 인터페이스에서 첨부 프롬프트를 볼 수 있습니다.
- 시력이 지원된다는 것을 확인하는 제공자 검사로 변경하세요.
auxiliary.vision.provider,model,base_url잘못 설정되어 있는지 확인하세요.provider: main를 사용할 경우, 마스터 모델도 멀티모달 모델이어야 합니다.
공식 설정 문서에는 Codex OAuth가 자동 감지 체인에서 비전을 지원한다는 점도 상기시켜 줍니다; 커스텀 엔드포인트는 호환성이 보장되어야 합니다.
한마디로: 영상 전송 실패는 주로 '사진이 붙여지지 않았다'가 아니라 보조 시각 모델이 이미지를 지원하지 못하는 경우입니다.
공식 오픈 소스 주소: https://github.com/NousResearch/hermes-agent; 공식 문서 입력: https://hermes-agent.nousresearch.com/.