戻るAI情報
ursorはCodex agentフレームワークをGPT-5.1-Codex-Maxおよびテストシステムの新バージョンに更新しました

ursorはCodex agentフレームワークをGPT-5.1-Codex-Maxおよびテストシステムの新バージョンに更新しました

AI情報 Admin 139 回閲覧

CursorはOpenAIの最新コーディングモデルであるGPT-5.1-Codex-Maxのエージェントフレームワークアップグレードについてブログ記事を公開しました。 チームは内部評価スイートCursor Benchを中心に、成功率、ツール呼び出し能力、実際の使用データなど多面的にCodexのパフォーマンスを最適化し、インテリジェントなAsanaコーディングトレーニングにおいてこのモデルバリアントを最大限に活用できるように、より堅牢なエージェントテストシステムを構築しました。

具体的な変更点としては、Cursorはツール名やセマンティクスをシェルコマンドにより近づけ、モデルが直接シェルコマンドを発行するのではなく、まず組み込みツールを呼び出すことを推奨し、ファイルやネットワークへのアクセスリスクを制御するためにサンドボックスメカニズムに依存しています。 Codex特有の「推論要約」では、チームは長さと頻度の仕様を設定し、中間でユーザーとの会話のプロンプトを排除して最終コードの品質を向上させました。 同時に、リンターエラーの処理を強化し、重要な変更後に明示的な指示を通じてread_lintsツールを使って問題を検出・自動修正するようモデルに導きます。

カー

ソルはまた、複数のツール呼び出し間でCodexの内部推論軌跡を保持し、ロングリンクタスクの計画的な連続性を維持し、軌道を逃した際にはアラームをトリガーして著しい性能低下を防ぐ必要性を強調しています。 インタラクションポリシーの観点から、モデルはデフォルトでユーザーが明示的に「解決策だけを提示してほしい」と要求しない場合、コードを書いたりツールを呼び出したり、システムやユーザーメッセージの順序を再構成して「トークンの保存」などのプロンプトと実際のタスク目標の競合を避けるように促しています。これによりエージェントの実行意欲が低下します。

FAQ

Q: このCodexのカーソルアップデートの核は何ですか?

A: 主な課題は、GPT-5.1-Codex-Max向けに、ツールの設定、プロンプト、推論軌跡、メッセージの順序など、より堅牢なエージェントテストおよび実行フレームワークを構築することです。

Q: なぜ道具名は外殻に近いものなのでしょうか?

A: Codexは訓練にシェルワークフローに大きく依存するため、モデルがCursorツールをより自然に使い、単純なシェルコマンドやインラインスクリプトに頼るのを防ぎます。

Q: 「推論トラック」を保持することがユーザーに与える影響は何ですか?

A: 複数のツールコール中でも明確な中長期計画をモデルに維持でき、サブ目標の忘れや繰り返される導出を減らし、複雑な修理タスクの成功率を向上させます。

Q: カーソルはどのようにしてコデックスをガイドしてリントエラーを自動的に修正しますか?

A: 実質的な編集を完了した後、read_lintsツールに連絡して最近修正したファイルを明確に促し、修正計画を判断できるエージェントに修正してもらう。

Q: このアップグレードは、通常のCursorユーザーにとって何を意味するのでしょうか?

A: Codexモデルを使うと、より積極的なコード修正、無効なインタラクションの減少、大規模なリファクタリングや多段階の修正シナリオでの安定した結果が期待できます。

カーソルはGPT5ポイント1 CodexMaxプロキシに適応 CursorBenchはエージェントテストシステムを最適化します GPT5ポイント:カーソルでの1CodexMaxパフォーマンスチューニング カーソルプロキシフレームワークツールの呼び出し機能をアップグレードしてください カーソルはツール名をシェルコマンドに近いものにします Codexはシェルよりも内蔵ツールの呼び出しを優先しています サンドボックスメカニズムは、ネットワークからコデックスファイルへのアクセスを制限します コーデックス推論概要の長さ周波数仕様設計 会話の途中でプロンプトを排除してコードの品質を向上させる カーソルはリンターエラーの自動修正を強化します 問題検出read_lintsガイドコデックス Codexは複数のツール呼び出しで推論軌道を維持します 内部推論トレースが欠損するとパフォーマンスアラームが発生します ロングリンク符号化タスクにおける計画的連続性 カーソルはCodexがデフォルトでコードを直接書くことを推奨しています ユーザーが要請しない場合、エージェントは積極的にツールを呼び出します システムおよびユーザーメッセージの順序ポリシーをリファクタリングします タスク目標に干渉するトークン保存プロンプトは避けましょう GPT5ポイント 1CodexMaxはインテリジェントなアーサナコーディングに重点を置いています CursorBench 多次元評価成功率とツール 実際の使用データに基づいてコデックスの挙動を微調整する カーソルエージェントは大規模なリファクタリングのための多段階修復をサポートします リンターフィードバックのクローズドループを強化し、コードの品質を向上させる CodexはIDE環境におけるエンドツーエンドの変更を可能にします ツールの意味論はモデルの混乱を減らすために表面的に配置されています カーソルはサンドボックスのセキュリティとコンプライアンスを守ります 推論サマリーは、非ユーザーとの相互作用に関する内部計画に焦点を当てています コデックスエージェントは複雑な修復作業に対してより堅牢です CursorBenchはエージェントのパフォーマンスを体系的に評価します 修正完了後にリントを読む必要があると明確に示されています コデックスは自動的にリントエラーを特定し修正します 無効なチャットを避け、交流の効率を高めましょう マルチラウンドツールコールにおけるサブターゲットの忘却を減らす カーソルはコーデックスの特徴に適応するプロンプトテンプレートを最適化します Codexはカーソルのプロジェクト構造をよりよく理解しています 推論軌道は監視され、警報機構を通じて推論軌道が完全に完成します カーソルエージェントフレームワークは手動介入の必要性を減らします GPT5ポイント 1CodexMaxはカーソルに深く結びついています チームコラボレーションのためのカーソルエージェントアップグレード エージェントは単にシナリオパターンを出すのではなく、自動的に実行します トークン保存のための重要なデバッグステップを放棄しないでください カーソルは現実世界のタスクの成功率向上に焦点を当てています Codexはマルチファイルの大規模コードベースに最適化されています カーソルはエージェントツールのエコシステムをより一貫性があり使いやすいものにします 統一ツール命名規則はモデル移行を促進します CursorBenchは多言語およびマルチフレームのシナリオをカバーしています CodexMaxはサンドボックス内でコマンドを安全に実行します カーソルはインテリジェントなアサナコーディングを主流に押し上げる 細かい制御推論要約はトークンの無駄を削減します 開発者は無効なインタラクションを減らすためにカーソルを使っています

おすすめツール

もっと見る