OpenAI gab bekannt, dass GPT-5.1 Entwicklern jetzt über eine API zur Verfügung steht, wobei die Preise an das bestehende GPT-5-Modell angepasst sind und für alle kostenpflichtigen Stufen verfügbar sind. Das bedeutet, dass Entwickler ohne Erhöhung des Stückpreises von Modellaufrufen die bestehende GPT-5-Integration direkt auf GPT-5.1 umstellen können, um stärkere Argumentations- und Anweisungsfolgefunktionen zu erhalten, ohne die Kostenstruktur oder die Quotenkonfiguration anpassen zu müssen.
Gleichzeitig werden auch GPT-5.1-Codex und GPT-5.1-Codex-Mini auf den Markt gebracht, die speziell für die langfristige Codierung und agentenbasierte Entwicklungsszenarien entwickelt wurden, die beide für die langwierige Codegenerierung, das Refactoring und automatisierte Entwicklungsprozesse optimiert sind. Während der Grundpreis unverändert bleibt, hat OpenAI auch die Aufbewahrungszeit für den Prompt-Cache auf maximal 24 Stunden für GPT-5.1 und seine Codex-Varianten verlängert, die denselben langen Kontext über mehrere Runden langer Sitzungen oder laufender Aufgaben hinweg wiederverwenden können, wodurch die umfassenden Gebühren erheblich gesenkt und die Verzögerungen beim Kaltstart in der ersten Runde reduziert werden.
FAQsF
: Wie hoch ist die Preisänderung von GPT-5.1 in der API?
A: OpenAI hat klargestellt, dass GPT-5.1 genauso abgerechnet wird wie GPT-5, wobei der ursprüngliche Stückpreis und die Ratengrenze verwendet werden, was eine Iteration von "Fähigkeits-Upgrades, aber die Preise bleiben unverändert" ist.
F: Wofür werden gpt-5.1-codex und gpt-5.1-codex-mini hauptsächlich verwendet?
A: Diese beiden Modelle sind für lang andauernde Codierungsaufgaben optimiert und eignen sich besser für Szenarien wie Codeproxys, automatisches Refactoring und groß angelegte Projekttransformationen und konzentrieren sich stärker auf die Stabilität und Nachhaltigkeit von Engineering-Workflows als GPT-5.1.
F: Was nützt es, den Eingabeaufforderungscache auf 24 Stunden zu erweitern?
A: In komplexen Projekten können Entwickler lange Systemansagen oder große Codebasiskontexte als Eingabeaufforderungen zwischenspeichern und innerhalb von 24 Stunden wiederholt aufrufen, ohne wiederholt dafür bezahlen zu müssen, wodurch die Kontextkosten für lange Sitzungen und lange Aufgaben erheblich reduziert und gleichzeitig die Anforderungslatenz reduziert wird.
F: Funktioniert das 24-Stunden-Caching nur für GPT-5.1?
A: Die verlängerte Prompt-Cache-Dauer gilt derzeit hauptsächlich für GPT-5.1 und die verwandten Familienmodelle, einschließlich gpt-5.1-codex und gpt-5.1-codex-mini, und der spezifische Anwendungsbereich unterliegt der offiziellen Dokumentation.