Hermes Agent 选模型时,不要只看榜单分数。最关键的是三件事:工具调用是否稳定、上下文长度是否够、你的任务是写代码、研究还是日常自动化。模型很聪明但不会稳定调工具,放在 Agent 场景里也会很难用。
主模型优先看工具能力
Hermes 的价值在于能调用终端、文件、网页、MCP、消息平台等工具。主模型要能正确输出工具调用,并能在工具结果回来后继续推理。很多“它只会聊天不干活”的案例,最后都和模型兼容性有关。
长任务还要看上下文
如果你经常让 Hermes 读项目、处理长会话或做多步研究,模型上下文不能太小。官方配置里还特别提醒:用于压缩的摘要模型,最好有不低于主模型的上下文窗口,否则压缩调用可能失败,甚至造成中间上下文丢失。
实用选择建议
- 代码修复:选工具调用稳定、长上下文较强的模型。
- 日常问答和轻任务:可用更便宜的 mini 或 flash 类模型。
- 本地模型:先确认 OpenAI 兼容接口和工具调用格式,不要只确认能聊天。
- 压缩、标题、视觉等辅助任务:单独配置辅助模型,别默认都走最贵主模型。
最稳的测试方法是让 Hermes 做一个小型真实任务:读一个文件、改一行、跑一次命令、总结结果。能完整走完这条链,再考虑把它设为日常主模型。