Retour à Informations sur l’IA
Ursor met à jour le cadre d’agents Codex pour supporter GPT-5.1-Codex-Max et la nouvelle version du système de test

Ursor met à jour le cadre d’agents Codex pour supporter GPT-5.1-Codex-Max et la nouvelle version du système de test

Informations sur l’IA Admin 139 vues

Cursor a publié un article de blog sur la mise à niveau du framework agent pour le dernier modèle de codage d’OpenAI, GPT-5.1-Codex-Max. L’équipe a construit un système de test d’agents plus robuste autour de la suite d’évaluation interne Cursor Bench, optimisant les performances du Codex dans l’environnement Cursor selon plusieurs dimensions telles que le taux de réussite, la capacité d’appel d’outils et les données d’utilisation réelle, afin de permettre à cette variante de modèle de s’entraîner au codage intelligent asana.

En ce qui concerne les changements spécifiques, Cursor rapproche la nommisation et la sémantique des outils des commandes shell, encourage les modèles à appeler d’abord les outils intégrés plutôt que d’émettre directement des commandes shell, et s’appuie sur des mécanismes de sandboxing pour contrôler les risques d’accès aux fichiers et au réseau. Pour les « résumés d’inférence » spécifiques au Codex, l’équipe définissait des spécifications de longueur et de fréquence, supprimant les invites pour les conversations avec les utilisateurs au milieu afin d’améliorer la qualité du code final. En même temps, il améliore la gestion des erreurs de linter et guide le modèle pour détecter et corriger automatiquement les problèmes à l’aide de read_lints outils après des modifications importantes grâce à des instructions explicites.

Cursor souligne également la nécessité de préserver la trajectoire d’inférence interne du Codex entre plusieurs appels d’outils afin de maintenir la continuité planifiée dans les tâches à long lien et de déclencher des alarmes en cas de trajectoires manquées afin d’éviter une dégradation significative des performances. En termes de politique d’interaction, le modèle est encouragé par défaut à agir directement pour écrire du code ou appeler des outils lorsque l’utilisateur ne demande pas explicitement « ne fournir que la solution », et à réorganiser l’ordre des messages système et utilisateur pour éviter les conflits entre des invites telles que « sauvegarder les jetons » et l’objectif réel de la tâche, affectant la volonté de l’agent d’exécuter.

FAQ

Q : Quel est le cœur de cette mise à jour du Curseur pour Codex ?

R : La tâche principale est de construire un cadre plus robuste de test et d’exécution d’agents pour GPT-5.1-Codex-Max, incluant la configuration des outils d’ajustement, les invites, les trajectoires d’inférence et l’ordre des messages.

Q : Pourquoi le nom de l’outil devrait-il être plus proche de la coque ?

R : Comme Codex repose fortement sur les workflows shell pour l’entraînement, cela aide le modèle à utiliser l’outil Curseur plus naturellement, plutôt que de retomber dans des commandes shell blunt ou des scripts en ligne.

Q : Quel est l’impact du maintien des « pistes d’inférence » sur les utilisateurs ?

R : Cela permet au modèle de maintenir un plan clair à moyen et long terme lors de plusieurs appels d’outils, réduisant ainsi l’oubli des sous-objectifs et les dérivations répétées, et améliorant le taux de réussite des réparations complexes.

Q : Comment Cursor guide-t-il Codex pour corriger automatiquement l’erreur de peluches ?

R : Appelez l’outil read_lints pour vérifier les fichiers récemment modifiés après avoir effectué des modifications substantielles en les sollicitant clairement, et laissez l’agent les corriger lorsqu’il pourra facilement juger du plan de correction.

Q : Que signifie cette mise à niveau pour les utilisateurs réguliers de Cursor ?

R : Les utilisateurs peuvent s’attendre à des modifications de code plus proactives, moins d’interactions invalides et des résultats plus stables lors de grands scénarios de refactorisation et de correction en plusieurs étapes lorsqu’ils utilisent le modèle Codex.

Le curseur s’adapte aux points GPT5 1 Proxy CodexMax CursorBench optimise le système de test d’agent Points GPT5 1CodexMax réglage des performances dans Cursor Mettre à jour la capacité d’appeler des outils du framework proxy Cursor Cursor rend le nom des outils proche des commandes shell Codex privilégie l’appel des outils intégrés plutôt que des shells Le mécanisme bac à sable restreint l’accès réseau aux fichiers Codex Résumé d’inférence du codex : conception de la spécification de fréquence Supprimez les prompts en cours de conversation pour améliorer la qualité du code Le curseur améliore la correction automatique des erreurs de linter Guide Codex pour utiliser read_lints afin de détecter les problèmes Codex maintient la trajectoire d’inférence avec plusieurs appels d’outils Les traces d’inférence internes manquantes déclenchent des alarmes de performance Continuité planifiée dans les tâches d’encodage à long lien Cursor encourage Codex à écrire du code directement par défaut L’agent invoque activement l’outil lorsque l’utilisateur ne le demande pas Refactoriser les politiques système et d’ordre des messages utilisateur Évitez de sauvegarder les jetons qui interfèrent avec les objectifs de la tâche GPT5 pointe 1CodexMax est orienté vers le codage asana intelligent Taux de réussite et outils d’évaluation multidimensionnelle de CursorBench Affiner le comportement du Codex en fonction des données d’utilisation réelles L’agent Cursor prend en charge les réparations en plusieurs étapes pour un refactoring important Renforcer la boucle fermée du feedback linter pour améliorer la qualité du code Codex permet des changements de bout en bout dans l’environnement IDE La sémantique de l’outil est proche de la coque pour réduire la confusion des modèles Cursor protège la sécurité et la conformité avec les bacs à sable Le résumé d’inférence se concentre sur la planification interne des interactions non utilisateur Les agents codex sont plus robustes pour les tâches complexes de remédiation CursorBench évalue systématiquement la performance des agents Cela indique clairement que vous devez lire les lints après avoir terminé la modification Codex localise et corrige automatiquement les erreurs de peluches Évitez les discussions invalides et améliorez l’efficacité des interactions Réduire l’oubli des sous-cibles lors des appels à outils multi-tours Cursor optimise les modèles d’invite pour s’adapter aux fonctionnalités du Codex Codex comprend mieux la structure des projets dans Cursor La trajectoire d’inférence est surveillée et la trajectoire d’inférence est complète via le mécanisme d’alarme Le cadre d’agent Cursor réduit le besoin d’intervention manuelle GPT5 points 1CodexMax est profondément lié au curseur Mise à niveau de l’agent curseur pour la collaboration en équipe L’agent s’exécute automatiquement au lieu de simplement donner le schéma de scénario Évitez d’abandonner les étapes de débogage des clés pour sauvegarder les jetons Cursor vise à améliorer le taux de réussite des tâches réelles Codex est optimisé pour les grandes bases de code multi-fichiers Cursor rend l’écosystème d’outils Agent plus cohérent et facile à utiliser Les conventions de nommage unifiées des outils facilitent la migration des modèles CursorBench couvre des scénarios multilingues et multi-images CodexMax exécute les commandes de manière sécurisée au sein du bac à sable Cursor propulse le codage asana intelligent dans le courant dominant Un résumé fin de l’inférence de contrôle réduit le gaspillage de jetons Les développeurs utilisent Cursor pour obtenir moins d’interactions invalides

Outils Recommandés

Plus