Am 28. Juni 2026 erklärte Elon Musk auf X, dass Grok 4.5 intern getestet wurde durch SpaceX und Tesla. Laut Offenlegungen basiert diese Version auf einem V9-Basismodell mit 1,5 Billionen Parametern und enthält cursorbezogene Daten im ergänzenden Training; frühe Bewertungen beschrieben sie als nahe oder möglicherweise sogar übertreffend an Opus. Eine genauere Einschätzung besagt, dass Grok 4.5 bereits in die reale Unternehmensvalidierung eingetreten ist, aber noch nicht offiziell veröffentlicht oder unabhängig bewertet wird.
Private Messorte sind bemerkenswerter als die Parameternummern
SpaceX und Tesla verfügen jeweils über technische F&E, Fertigung, Fahrzeugsoftware und umfangreiche interne Wissensprozesse. Wenn das Modell bei diesen beiden Unternehmen getestet wird, wird es nicht nur die Chat-Leistung bewerten, sondern kann auch Codegenerierung, lange Aufgabenausführung, interne Datenabrufe und Toolaufrufe umfassen. Für xAI kann eine solche Umgebung schnell Probleme bei Berechtigungen, Stabilität und komplexen Arbeitsabläufen aufdecken und zudem Feedback für die anschließende Produktisierung sammeln.
Das Hinzufügen von Cursor-Daten deutet ebenfalls auf Programmierfähigkeit hin, aber "welche Daten hinzugefügt werden, welcher Umfang der Autorisierung ist und welcher Anteil der Daten derzeit nicht öffentlich bekannt gegeben wird." Parametergrößen sind lediglich Größeninformationen und können die Antwortqualität, die Effizienz des Argumentierens oder die Nutzungskosten nicht direkt beweisen.
"Approaching Opus" kann vorerst nur als Entwicklerurteil betrachtet werden
Musk spezifizierte nicht an, auf welche Version von Opus sich hier bezieht, noch gab er den Review-Set, die Stichprobengröße oder die Testbedingungen bekannt. Die Überlegenheit eines Modells bei internen Aufgaben bedeutet nicht, dass es in allgemeinen Fragen und Antworten, Code-Repository-Modifikationen oder Aufgaben mit langen Kontexten stärker ist. Gerade während der privaten Testphase beeinflussen Systemeingaben, Werkzeugketten und Inferenzbudgets die Ergebnisse erheblich.
Daher ist es in diesem Stadium nicht angemessen, Modelle auf dieser Grundlage zu migrieren. Worauf Enterprise-Entwickler wirklich warten müssen, ist, ob die API offen ist, Kontextlänge und Preis, Ratenbegrenzungen, die Leistung von Tool-Anrufen und reproduzierbare Drittanbieter-Reviews.
Welche Signale sendet dieser Schritt?
Der Wettbewerbsfokus von Grok verlagert sich von Einzelmodell-Releases hin zum "Model plus Enterprise Scenarios plus Execution Framework". Musk erwähnte außerdem die fortlaufende Verbesserung der Grok Build-Toolchain und sagte, SpaceX plane, dieses Jahr monatlich neue Modelle zu trainieren. Hochfrequente Iterationen können Rückkopplungszyklen verkürzen, bringen aber auch Probleme hinsichtlich der Versionsstabilität und Migrationskosten mit sich. Wenn Grok 4.5 offiziell gestartet wird, solltest du, um festzustellen, ob es sich lohnt, zuerst auf die tatsächliche Erfolgsrate der Aufgabe achten, nicht nur auf die Anzahl der Parameter oder die horizontale Bewertung des Entwicklers.
Informationsquelle
Elon Musks ursprüngliche Nachricht veröffentlicht auf X; Investing.com Bericht vom 28. Juni 2026.