Cursor hat einen Blogbeitrag über sein Agenten-Framework-Upgrade für OpenAIs neuestes Programmiermodell, GPT-5.1-Codex-Max, veröffentlicht. Das Team hat ein robusteres Agententestsystem rund um die interne Bewertungssuite Cursor Bench aufgebaut und die Leistung von Codex in der Cursor-Umgebung aus mehreren Dimensionen wie Erfolgsrate, Werkzeugaufruffähigkeit und realen Nutzungsdaten optimiert, um diese Modellvariante für intelligentes Asana-Codierungstraining voll auszuspielen.
Was spezifische Änderungen betrifft, so bringt Cursor die Tool-Benennung und -Semantik näher an Shell-Befehle, ermutigt Modelle, zuerst eingebaute Tools aufzurufen, anstatt direkt Shell-Befehle zu vergeben, und setzt auf Sandboxing-Mechanismen zur Kontrolle von Datei- und Netzwerkzugriffsrisiken. Für codex-spezifische "Inferenzzusammenfassungen" legt das Team Längen- und Frequenzspezifikationen fest und entfernt Eingaben für Gespräche mit den Nutzern in der Mitte, um die Qualität des endgültigen Codes zu verbessern. Gleichzeitig verbessert es die Behandlung von Linner-Fehlern und leitet das Modell darin, Probleme mit read_lints Tools nach wichtigen Änderungen durch explizite Anweisungen zu erkennen und automatisch zu beheben.
Cursor betont außerdem die Notwendigkeit, die interne Inferenztrajektorie des Codex zwischen mehreren Tool-Aufrufen zu bewahren, um die geplante Kontinuität bei Long-Link-Aufgaben aufrechtzuerhalten und Alarme auszulösen, wenn Trajektorien fehlen, um erhebliche Leistungseinbußen zu verhindern. Im Hinblick auf die Interaktionspolitik wird das Modell standardmäßig dazu ermutigt, direkt Code zu schreiben oder Werkzeuge aufzurufen, wenn der Benutzer nicht ausdrücklich "nur die Lösung geben" anfordert, und die Reihenfolge der System- und Benutzernachrichten neu zu organisieren, um Konflikte zwischen Prompts wie "Save Tokens" und dem eigentlichen Aufgabenziel zu vermeiden, was die Bereitschaft des Agenten zur Ausführung beeinträchtigt.
FAQ
F: Was ist der Kern dieses Cursor-Updates für Codex?
A: Die Hauptaufgabe besteht darin, ein robusteres Agententest- und Ausführensframework für GPT-5.1-Codex-Max zu entwickeln, einschließlich der Konfiguration von Tuning-Tools, Prompts, Inferenztrajektorien und Nachrichtenreihenfolge.
F: Warum sollte der Werkzeugname näher am Gehäuse stehen?
A: Da Codex stark auf Shell-Workflows für das Training setzt, hilft dies dem Modell, das Cursor-Tool natürlicher zu nutzen, anstatt auf stumpfe Shell-Befehle oder Inline-Skripte zurückzugreifen.
F: Welche Auswirkungen hat das Behalten von "Inferenzspuren" auf die Nutzer?
A: Es ermöglicht dem Modell, während mehrerer Werkzeugaufrufe einen klaren mittel- und langfristigen Plan zu halten, wodurch das Vergessen von Teilzielen und wiederholter Herleitungen reduziert wird und die Erfolgsrate komplexer Reparaturaufgaben verbessert wird.
F: Wie leitet der Cursor Codex automatisch, um den Lint-Fehler zu beheben?
A: Rufen Sie das read_lints Tool an, um die kürzlich geänderten Dateien nach Abschluss der wesentlichen Änderungen durch klare Aufforderung zu überprüfen, und lassen Sie den Agenten sie korrigieren, wenn er den Reparaturplan leicht einschätzen kann.
F: Was bedeutet dieses Upgrade für normale Cursor-Nutzer?
A: Nutzer können mit proaktiveren Codeänderungen, weniger ungültigen Interaktionen und stabileren Ergebnissen in großen Refaktorisierungs- und Mehrstufe-Fixszenarien rechnen, wenn sie das Codex-Modell verwenden.