OpenAI 发布「Why we built the Responses API」阐述设计取向:Responses 以“推理-行动-反馈”的状态化循环取代单回合对话,允许模型在多轮中保留内部推理状态,并一次返回多种“项目”(消息、函数调用、结构化输出等),适配文本、图像、音频与函数调用等多模态交互。该接口旨在为 GPT-5 等推理模型提供原生的 agent 工作流承载与可审计轨迹。
官方同时强调托管工具的进阶整合(如 Web 搜索、图像生成、File Search、Code Interpreter 与 MCP),以服务端执行缩短往返与降低成本。内部数据指出,相比 Chat Completions,Responses 在缓存利用率与时延上更优;并给出 TAUBench 分数小幅提升的例证。历史脉络上,Responses 自 2025 年 3 月起面向开发者推出,并被定位为未来默认路径;Assistants API 进入迁移期,官方建议逐步切换。
常见问题
Q:Responses API 是什么?
A:一个统一、状态化、多模态的接口,支持保留推理状态、结构化输出与托管工具调用,用于构建 agent 工作流。
Q:与 Chat Completions/Assistants 有何区别?
A:前者偏单回合消息流;Responses 引入“推理与动作项”的事件序列并原生整合工具;Assistants 的能力逐步并入 Responses。
Q:支持哪些托管工具与能力?
A:Web 搜索、图像生成、File Search、Code Interpreter、MCP 等,可在服务器侧执行以降低延迟与集成复杂度。
Q:是否会暴露链路推理(CoT)?
A:不直接暴露;接口保留并加密内部推理,可用 previous_response_id 等安全延续上下文。
Q:Assistants API 会下线吗?
A:处于迁移期,媒体与官方资料均指向中期淘汰路径;建议新项目优先采用 Responses,存量项目按指引迁移。