OpenAI a annoncé que GPT-5.1 est désormais disponible pour les développeurs via une API, avec des prix alignés sur le modèle GPT-5 existant et disponibles pour tous les niveaux payants. Cela signifie que sans augmenter le prix unitaire des appels de modèle, les développeurs peuvent directement basculer l’intégration GPT-5 existante vers GPT-5.1 pour obtenir des capacités de raisonnement et de suivi d’instructions plus fortes sans ajuster la structure de coûts ou la configuration des quotas.
Dans le même temps, GPT-5.1-Codex et GPT-5.1-Codex-Mini, qui sont spécialement conçus pour le codage à long terme et les scénarios de développement basés sur des agents, sont également lancés, tous deux optimisés pour la génération de code de longue durée, la refactorisation et les processus de développement automatisés. Bien que le prix de base reste inchangé, OpenAI a également prolongé le temps de rétention du cache Prompt à un maximum de 24 heures pour GPT-5.1 et ses variantes Codex, qui peuvent réutiliser le même contexte long sur plusieurs séries de longues sessions ou de tâches en cours, réduisant considérablement les frais complets et réduisant les délais de démarrage à froid de premier tour.
FAQsQ
: Quel est le changement de prix de GPT-5.1 dans l’API ?
R : OpenAI a clairement indiqué que GPT-5.1 est facturé de la même manière que GPT-5, en utilisant le prix unitaire et la limite de débit d’origine, qui sont une itération de « mises à niveau de capacités mais les prix restent inchangés ».
Q : À quoi servent principalement gpt-5.1-codex et gpt-5.1-codex-mini ?
R : Ces deux modèles sont optimisés pour les tâches de codage de longue durée et sont plus adaptés à des scénarios tels que les proxys de code, la refactorisation automatique et la transformation de projet à grande échelle, et sont plus axés sur la stabilité et la durabilité des flux de travail d’ingénierie que GPT-5.1.
Q : À quoi bon étendre le cache d’invite à 24 heures ?
R : Dans les projets complexes, les développeurs peuvent mettre en cache de longues invites système ou des contextes de base de code volumineux en tant qu’invites et les appeler à plusieurs reprises dans les 24 heures sans les payer à plusieurs reprises, ce qui réduit considérablement le coût du contexte des longues sessions et des tâches longues tout en réduisant la latence des demandes.
Q : La mise en cache de 24 heures ne fonctionne-t-elle que pour GPT-5.1 ?
R : La durée étendue du cache d’invite est actuellement principalement pour GPT-5.1 et ses modèles de famille associés, y compris gpt-5.1-codex et gpt-5.1-codex-mini, et le champ d’application spécifique est soumis à la documentation officielle.