Hermes Agent API 多轮对话老是像“失忆”,很多时候不是模型笨,而是你接错了接口。官方 API Server 文档明确写着:/v1/chat/completions 是无状态接口,完整上下文必须每次都由客户端通过 messages 自己带上。
最常见误区
不少前端第一次发一句话能正常回复,第二轮只再发一句“继续”,结果 Hermes Agent 像忘了上一句。这不是它没保存,而是你调用的是 Chat Completions 路径,而这个路径天生就不替你保会话。
怎么修
- 如果继续用
/v1/chat/completions,每次都把完整消息历史带上。 - 如果你想让服务端帮你接住上下文,换成
/v1/responses。 - 别把“OpenAI 兼容”误解成“服务器会自动保存所有多轮状态”。
一句话:多轮总断,不一定是 Hermes Agent 出错,先看你是不是还在用无状态的 Chat Completions。
官方开源地址:https://github.com/NousResearch/hermes-agent;官方文档入口:https://hermes-agent.nousresearch.com/。