Le 28 juin 2026, Elon Musk a déclaré sur X que Grok 4.5 était entré en test interne par SpaceX et Tesla. Selon les divulgations, cette version est basée sur un modèle de base V9 à 1,5 billion de paramètres et inclut des données liées au Cursor dans l’entraînement supplémentaire ; les premières évaluations la décrivaient comme proche, voire supérieure, à Opus. Une évaluation plus précise à ce stade est que Grok 4.5 est entré dans une validation d’entreprise réelle mais ne correspond pas encore à une version officielle ou à une évaluation indépendante.
Les emplacements de mesure privés sont plus remarquables que les chiffres des paramètres
SpaceX et Tesla disposent chacun de la R&D en ingénierie, de la fabrication, des logiciels pour véhicules et de vastes processus internes de connaissances. Si le modèle est testé dans ces deux entreprises, il évaluera non seulement la performance du chat, mais pourra aussi inclure la génération de code, l’exécution de tâches prolongées, la récupération interne des données et les appels d’outils. Pour l’IA x, un tel environnement peut rapidement exposer des problèmes de permissions, de stabilité et de flux de travail complexes, tout en recueillant des retours pour une productisation ultérieure.
L’ajout de données Cursor indique aussi la capacité de programmation, mais « quelles données sont ajoutées, quelle est la portée de l’autorisation, et quelle proportion de données n’est actuellement pas divulguée publiquement ». Les quantités de paramètres ne sont que des informations de taille et ne peuvent pas prouver directement la qualité de la réponse, l’efficacité de raisonnement ou le coût d’utilisation.
« Approcher l’Opus » ne peut être considéré pour l’instant qu’à l’avis d’un développeur
Musk n’a pas précisé à quelle version d’Opus fait référence ici, ni divulgué l’ensemble de revues, la taille de l’échantillon ou les conditions de test. La supériorité d’un modèle dans les tâches internes ne signifie pas qu’il est plus fort en Q&A générale, dans les modifications de dépôt de code ou dans les tâches à long contexte. Surtout pendant la phase de tests privés, les invites système, les chaînes d’outils et les budgets d’inférence influencent tous significativement les résultats.
Par conséquent, il n’est pas approprié de migrer des modèles à partir de cette base à ce stade. Ce que les développeurs d’entreprise doivent vraiment attendre, c’est si l’API est ouverte, la longueur et le prix du contexte, les limites de fréquence, les performances des appels d’outils et les avis reproductibles par des tiers.
Quels signaux ce mouvement envoie-t-il ?
L’orientation concurrentielle de Grok évolue des versions de modèles uniques vers le « modèle plus scénarios d’entreprise plus cadre d’exécution ». Musk a également mentionné l’amélioration continue de la chaîne d’outils Grok Build et a indiqué que SpaceX prévoit d’entraîner de nouveaux modèles chaque mois cette année. Les itérations à haute fréquence peuvent raccourcir les cycles de rétroaction mais entraînent aussi des problèmes de stabilité des versions et de coûts de migration. Si Grok 4.5 est officiellement lancé, pour déterminer s’il vaut la peine de l’utiliser, il faut d’abord regarder le taux réel de réussite des tâches, pas seulement le nombre de paramètres ou l’évaluation horizontale du développeur.
Source de l’information
Le message original d’Elon Musk publié sur X ; Investing.com rapport du 28 juin 2026.