OpenAIは「Responses APIを構築した理由」を公開し、その設計方針を説明しています。Responsesは、単一ターンの対話をステートフルな「推論-行動-フィードバック」ループに置き換えます。これにより、モデルは複数ターンにわたって内部推論状態を保持し、複数の「アイテム」(メッセージ、関数呼び出し、構造化出力など)を同時に返すことができるため、テキスト、画像、音声、関数呼び出しなどのマルチモーダルなインタラクションに適応できます。このAPIは、GPT-5のような推論モデルにネイティブエージェントワークフローのサポートと監査可能なトレースを提供することを目的としています。
担当者はまた、マネージドツール(Web検索、画像生成、ファイル検索、コードインタープリタ、MCPなど)の高度な統合により、ラウンドトリップを削減し、サーバー側での実行によるコスト削減を実現する点も強調しました。社内データによると、ResponsesはChat Completionsよりもキャッシュ利用率とレイテンシが優れており、TAUBenchスコアもわずかに向上しています。Responsesは2025年3月から開発者向けに提供されており、今後のデフォルトパスとして位置付けられています。アシスタントAPIは移行フェーズに入っており、担当者は段階的な移行を推奨しています。
よくある質問
Q: レスポンス API とは何ですか?
A: エージェント ワークフローを構築するための推論状態、構造化された出力、および管理されたツール呼び出しの保持をサポートする、統合されたステートフルなマルチモーダル インターフェースです。
Q: チャット補完/アシスタントとの違いは何ですか?
A: 前者は単一ラウンドのメッセージ フローに近く、レスポンスでは「推論とアクション項目」のイベント シーケンスが導入され、ツールがネイティブに統合されます。アシスタントの機能はレスポンスに徐々に組み込まれます。
Q: どのようなホスティング ツールと機能がサポートされていますか?
A: Web 検索、画像生成、ファイル検索、コードインタープリター、MCP などをサーバー側で実行することで、レイテンシと統合の複雑さを軽減できます。
Q: Link of Trace (CoT) は公開されますか?
A: 直接公開されません。インターフェースは内部推論を保持および暗号化し、previous_response_id などの安全な継続コンテキストを使用できます。
Q: アシスタント API は廃止されますか?
A: 現在移行段階にあり、メディアや公式情報では中期的な廃止が示唆されています。新規プロジェクトではレスポンスを優先し、既存プロジェクトはガイドラインに従って移行することをお勧めします。