ursor 更新 Codex 智能体框架支持 GPT-5.1-Codex-Max 与新版测试体系

AI资讯 • Admin • 2025/12/5 • 163 次浏览

Cursor 发布博文介绍其针对 OpenAI 最新编码模型 GPT-5.1-Codex-Max 的代理框架升级。团队围绕内部评测套件 Cursor Bench 构建了更健壮的 Agent 测试体系，从成功率、工具调用能力和真实使用数据多维度优化 Codex 在 Cursor 环境中的表现，以便充分发挥这一面向智能体式编码训练的模型变体。

在具体改动上，Cursor 使工具命名和语义更贴近 shell 命令，鼓励模型优先调用内置工具而非直接下发 shell 指令，并依托沙箱机制控制文件与网络访问风险。对于 Codex 特有的“推理摘要”，团队设定了长度与频率规范，移除中途与用户对话的提示，以提升最终代码质量。同时强化对 linter 错误的处理，通过明确指令引导模型在重要修改后使用 read_lints 工具检测并自动修复问题。

Cursor 还强调必须完整保留 Codex 在多次工具调用之间的内部推理轨迹，以维持长链路任务中的计划连续性，并在缺失轨迹时触发告警，防止性能显著下降。在交互策略上，默认鼓励模型在用户未明确要求“只给方案”时直接采取行动写码或调用工具，并重新梳理 system 与用户消息顺序，避免诸如“节省 tokens”类提示与实际任务目标冲突，影响代理执行意愿。

常见问题

Q：这次 Cursor 针对 Codex 的更新核心是什么？

A：主要是为 GPT-5.1-Codex-Max 构建更稳健的 Agent 测试与运行框架，包括工具配置、提示词、推理轨迹和消息顺序等多方面调优。

Q：为什么要让工具命名更接近 shell？

A：因为 Codex 在训练中高度依赖 shell 工作流，这样有助于模型更自然地使用 Cursor 工具，而不是退回到生硬的 shell 命令或内联脚本。

Q：保留“推理轨迹”对用户有什么影响？

A：可让模型在多次工具调用过程中保持清晰的中长期计划，减少遗忘子目标和反复推导，提升复杂修复任务的成功率。

Q：Cursor 如何引导 Codex 自动修复 Lint 错误？

A：通过明确提示在完成实质性编辑后调用 read_lints 工具检查最近修改的文件，并在能轻易判断修复方案时由智能体自行修正。

Q：这次升级对普通 Cursor 用户的意义是什么？

A：用户在使用 Codex 模型时，预计会获得更主动的代码修改、更少无效交互以及在大型重构和多步修复场景下更稳定的结果。

ursor 更新 Codex 智能体框架支持 GPT-5.1-Codex-Max 与新版测试体系

相关文章

Google 为 Gemini Ultra 用户上线 Gemini 3 Deep Think 模式强调并行推理能力

有爆料称 Google 计划将 Opal 流程构建器作为「Super Gem」集成进 Gemini

Kimi K3正式上线：2.8万亿参数押注百万上下文与开放权重

Mistral Studio 新增提示词版本管理：企业 AI 开始管行为资产

推荐工具

ursor 更新 Codex 智能体框架 支持 GPT-5.1-Codex-Max 与新版测试体系

相关文章

Google 为 Gemini Ultra 用户上线 Gemini 3 Deep Think 模式 强调并行推理能力

有爆料称 Google 计划将 Opal 流程构建器作为「Super Gem」集成进 Gemini

Kimi K3正式上线：2.8万亿参数押注百万上下文与开放权重

Mistral Studio 新增提示词版本管理：企业 AI 开始管行为资产

推荐工具

提交AI工具

请确认提交信息

ursor 更新 Codex 智能体框架支持 GPT-5.1-Codex-Max 与新版测试体系

Google 为 Gemini Ultra 用户上线 Gemini 3 Deep Think 模式强调并行推理能力