Au cours des dernières 24 heures (7 novembre), Google Cloud a lancé sa nouvelle génération de TPU Ironwood et a divulgué des indicateurs de performance pour ses clusters à grande échelle ; en Europe, des informations ont fait état d'une réévaluation du rythme de mise en œuvre de la législation sur l'IA ; en Chine, le Sommet de Wuzhen de la Conférence mondiale sur l'Internet et l'exposition « La lumière d'Internet » ont ouvert leurs portes, iFlytek a lancé le modèle de données massives d'inférence profonde Spark X1.5, et XPeng a lancé son modèle VLA de deuxième génération et a précisé son calendrier de production et de déploiement à grande échelle.
I. Google annonce l'intégration d'Ironwood TPU dans Google Analytics, repoussant ainsi les limites de la puissance de calcul pour l'entraînement et l'inférence.
- Annoncé le 7 novembre : Ironwood offre environ 10 fois les performances de pointe du TPU v5p et plus de 4 fois les performances monopuce du v6e en matière d'entraînement et d'inférence.
- Un seul « SuperPod » peut être étendu jusqu'à 9216 puces, formant environ 1,77 PB de HBM partagé et 9,6 Tbit/s de bande passante d'interconnexion, prenant en charge une architecture unifiée allant de l'apprentissage par renforcement à l'inférence en ligne massive.
- Google indique qu'Anthropic aura accès à « jusqu'à 1 million de TPU » et collaborera avec Ironwood pour prendre en charge des services à grande échelle pour des modèles de pointe tels que Claude, marquant une diversification supplémentaire de son paysage de puissance de calcul IA.
II. L’UE envisage une suspension « ciblée » de la mise en œuvre de certaines dispositions de la loi sur l’IA.
- Le 7 novembre, plusieurs médias ont cité des sources indiquant qu'après avoir communiqué avec les États-Unis et les principales entreprises technologiques, la Commission européenne discutait du calendrier de mise en œuvre des ajustements apportés à certaines dispositions, et que la décision finale devrait être prise aux alentours du 19 novembre.
- L’UE a réitéré son soutien aux objectifs et aux principes du projet de loi sur l’IA, en privilégiant l’optimisation du calendrier et du rythme de mise en œuvre plutôt que de « repartir de zéro ».
- Si ces ajustements sont mis en œuvre, ils auront une incidence sur la feuille de route de conformité des systèmes à haut risque et sur le rythme de la transformation technologique des entreprises. Ces dernières doivent être attentives aux détails et aux modalités de la période de transition.
III. Anthropic poursuit son expansion en Europe, en ouvrant des bureaux à Paris et à Munich.
- Le 7 novembre, il a été officiellement annoncé que l'entreprise allait ouvrir des bureaux en France et en Allemagne, avec une équipe complète allant de la R&D aux ventes et aux opérations, afin de renforcer ses capacités de prestation locales dans la zone EMEA.
- La société a déclaré que son activité européenne a vu son chiffre d'affaires annuel augmenter de plus de neuf fois au cours de l'année écoulée et qu'elle a établi des partenariats solides avec des clients régionaux (y compris des géants de l'automobile et de la vente au détail).
- Grâce à ses ressources TPU massives et à sa stratégie multicloud, la disponibilité et la rapidité des services modèles sur le marché européen devraient encore s'améliorer.
IV. Les États-Unis prévoient d'empêcher Nvidia de vendre des puces d'IA « réduites » à la Chine.
- Un rapport du 7 novembre indiquait que le gouvernement américain envisageait de restreindre la vente à la Chine d'une version allégée d'une puce d'intelligence artificielle, nom de code B30A. Des échantillons de cette puce avaient déjà été présentés à certains clients.
- Nvidia a répondu qu'elle ne détenait actuellement « aucune part de marché sur le marché chinois des centres de données et n'était pas incluse dans les directives ».
- Du côté chinois, des directives récentes exigent également que les projets financés par le gouvernement privilégient les « puces nationales », et cette concurrence à deux vitesses accélère la localisation de la chaîne d'approvisionnement en matériel d'IA.
V. OpenAI précise : les discussions avec le gouvernement portaient sur des garanties de prêts pour les « usines de puces », et non pour les centres de données.
- Le 6 novembre (7 novembre, heure de Pékin), OpenAI a déclaré que la garantie de prêt fédérale en discussion se concentre sur la « fabrication de puces » et ne vise pas à fournir des garanties pour les centres de données auto-construits.
- D'après les déclarations publiques de l'entreprise, l'investissement de capitaux prévu pour les huit prochaines années s'élève à environ 1 400 milliards de dollars américains, et le chiffre d'affaires annuel devrait dépasser 20 milliards de dollars américains. Parallèlement, l'entreprise explore un modèle de cloud IA basé sur la vente directe de puissance de calcul.
- La Maison Blanche a déclaré qu'elle ne fournirait pas d'aide à l'ensemble du secteur et que l'expansion de l'infrastructure d'IA reposerait davantage sur les mécanismes de marché et les structures de capital multilatérales.
VI. Le Sommet de Wuzhen de la Conférence mondiale sur l'Internet s'ouvre, avec l'exposition « Lumière d'Internet » axée sur « Intelligence artificielle + ».
- L'exposition a ouvert ses portes le 6 novembre sur le thème « Symbiose avec l'IA, avenir intelligent ». Elle proposait sept espaces d'exposition thématiques et réunissait 670 entreprises, présentes en ligne et en présentiel, présentant plus de 1 000 technologies et produits d'IA.
- Le forum principal du sommet s'est concentré sur des sujets tels que les modèles de pointe en matière de mégadonnées, la gouvernance des données, l'IA digne de confiance et la mise en œuvre industrielle, servant de fenêtre sur la synergie entre l'application et la gouvernance de l'IA en Chine.
- La conférence se déroulera jusqu'au 9 novembre et devrait permettre de mettre en lumière un certain nombre de coopérations industrielles et de réalisations technologiques.
VII. iFlytek publie le modèle d'inférence profonde Spark X1.5
- Publié le 6 novembre : Selon l'entreprise, avec une échelle de paramètres plus petite, les performances globales sont « comparables aux grands modèles internationaux courants », et les performances globales atteindraient « plus de 95 % de celles de GPT-5 » (cette affirmation nécessite une vérification supplémentaire par des benchmarks tiers).
- Sur le plan technique, on affirme que « l'efficacité de l'entraînement par renforcement de la longue chaîne de pensée » est passée d'environ 30 % à plus de 84 %, et que l'efficacité de l'entraînement complet du MoE (Expert Hybrid) a été considérablement améliorée.
- Côté déploiement, il est souligné qu’« un serveur standard Ascend peut être déployé », mettant en avant la puissance de calcul nationale et l’écosystème matériel et logiciel intégré.
8. XPeng Technology lance le modèle VLA de deuxième génération et précise le calendrier de déploiement du véhicule.
- Sortie le 7 novembre : La VLA de deuxième génération produit une « vision → action » de bout en bout, réduisant le lien linguistique intermédiaire ; le kilométrage moyen de prise en charge du « NGP de petite route » pour les petites routes complexes a été augmenté d'environ 13 fois.
- Calendrier de mise en œuvre : L’expérience « Co-création pionnière » sera lancée le mois prochain et le déploiement complet auprès des utilisateurs débutera au premier trimestre de l’année prochaine, en même temps que le modèle Ultra.
- La collaboration avec Volkswagen progresse en parallèle, la puce d'IA Turing de Xpeng ayant décroché un contrat avec Volkswagen, rationalisant davantage le processus du véhicule intelligent, du modèle à la puissance de calcul.
9. Ant Group a présenté pour la première fois à Wuzhen sa « Famille de grands modèles Braille » et a remporté un prix lors de la conférence.
- Les 6 et 7 novembre : L’ensemble de la famille de modèles Behring sera présenté pour la première fois. Dix-huit modèles, couvrant le langage, la pensée et le multimodal, ont été dévoilés. Il est affirmé que deux modèles à mille milliards de paramètres (Ling-1T et Ring-1T) ont atteint un niveau de performance de pointe dans le domaine des logiciels libres (notamment une performance de niveau « médaille d’argent » aux IMO2025, etc., d’après les médias et les experts techniques présents sur place).
- Côté scène, le gestionnaire de santé IA AQ (qui prétend pouvoir se connecter aux ressources de plus de 5 000 établissements médicaux à l'échelle nationale), le robot incarné Robbyant-R1 et l'interaction de confiance gPass ont été présentés.
- Ant Computing a remporté le « Prix de la contribution exceptionnelle (catégorie potentiel de croissance) » lors de la Conférence mondiale sur l'Internet, soulignant la valeur industrielle de l'informatique privée et de la circulation de données de confiance.
10. Un chercheur de DeepSeek prend la parole publiquement à Wuzhen : il exprime sa prudence quant à l’impact social à long terme de l’IA.
- Lors de l'événement du 7 novembre, un chercheur principal de DeepSeek a déclaré lors du « Dialogue des Six Petits Dragons de Wuzhen » qu'il avait une attitude positive à l'égard de l'amélioration de l'efficacité à court terme de l'IA, mais qu'il restait prudent quant à son impact à moyen et long terme sur l'emploi et la société.
- Depuis que DeepSeek a acquis une certaine notoriété en début d'année grâce à ses modèles performants et économiques, l'entreprise s'est faite relativement discrète. Cette déclaration a relancé le débat sur le lien entre « bénéfices technologiques et résilience sociale ».
- Cet incident reflète également la stratégie et la pression de l’écosystème local de l’IA en Chine, qui poursuit trois voies parallèles : « les modèles open source, l’adaptation de la puissance de calcul nationale et l’application industrielle ».
Foire aux questions (Q&R)
Q : Quels sont les indicateurs clés de performance et le délai de commercialisation du TPU Ironwood ?
A : Le 7 novembre, l'entrée en phase de disponibilité générale a été annoncée, et le déploiement auprès des clients est prévu dans les semaines à venir. Ses performances sont environ 10 fois supérieures aux performances maximales de la v5p, et plus de 4 fois supérieures aux performances d'entraînement et d'inférence sur une seule puce de la v6e ; un seul Pod peut gérer jusqu'à 9 216 puces, avec environ 1,77 Po de mémoire HBM partagée et une interconnexion de 9,6 Tbit/s.
Q : Le projet de loi européen sur l'IA va-t-il vraiment être « suspendu » ? Quel sera l'impact à court terme ?
A : Le report actuel est un « report ciblé » évoqué dans les discussions internes et les médias, et non un arrêt définitif ; l’UE maintient son soutien aux objectifs du projet de loi. À court terme, l’impact concerne principalement le calendrier de mise en conformité et les dispositions transitoires relatives aux systèmes et modèles sous-jacents à haut risque ; les entreprises doivent suivre attentivement les déclarations publiques officielles prévues entre mi-novembre et fin novembre.
Q : À quoi fait exactement référence le montant de « 1,4 billion de dollars » auquel OpenAI fait référence ?
A : La déclaration publique de l'entreprise porte sur « l'ampleur de son engagement en matière de capitaux au cours des huit prochaines années », couvrant les investissements à long terme dans la puissance de calcul et l'écosystème des puces en amont ; dans le même temps, elle a précisé qu'elle n'a pas sollicité de garanties de prêt fédérales pour les centres de données et que l'accent est mis sur la discussion avec le gouvernement des plans de renforcement de la fabrication et de la chaîne d'approvisionnement des puces.
Q : Quand la deuxième génération du XPeng VLA sera-t-elle disponible ? Quelles sont les améliorations ?
A : Le calendrier officiel prévoit que la co-création pionnière débutera en décembre et que le déploiement complet aura lieu avec les modèles Ultra au premier trimestre 2026 ; le kilométrage moyen de reprise en main dans des scénarios routiers complexes sera multiplié par environ 13 et les nouvelles fonctionnalités incluent la « conduite assistée automatique sans navigation ».
Q : Quelles modifications techniques ont été apportées à l'iFlytek Starfire X1.5 « Deep Inference » ?
A : L'entreprise affirme que l'efficacité de l'apprentissage par renforcement à longue chaîne a été considérablement améliorée (environ 30 % → 84 % et plus), que l'efficacité de l'entraînement du lien MoE a été accrue et souligne sa capacité de déploiement sur la plateforme nationale Ascend ; cependant, le classement précis des performances globales par rapport aux principaux modèles internationaux nécessite encore des benchmarks tiers et des évaluations publiques.