Ces dernières 24 heures (7-8 novembre), des informations en provenance d'Europe ont fait état d'un possible ralentissement de la mise en œuvre de la réglementation sur l'IA ; les géants technologiques américains ont continué d'investir massivement dans les infrastructures d'IA à grande échelle et d'accélérer leur expansion internationale ; parallèlement, le Sommet de Wuzhen a annoncé une série de prix et de progrès pour le secteur, et XPeng a publiquement « démonté » son robot humanoïde afin de clarifier les controverses. La dynamique en Chine et en Amérique du Nord/Europe est globalement similaire.
I. Google lance Ironwood TPU, marquant le début officiel de « l'ère de l'inférence »
- Google a annoncé que son TPU Ironwood de septième génération sera largement disponible dans les semaines à venir, revendiquant une amélioration des performances de pointe de 10 fois par rapport au TPU v5p et une amélioration des performances monocœur de 4 fois par rapport au v6e, ciblant l'entraînement à grande échelle et l'inférence à faible latence.
- Un seul Pod peut évoluer jusqu'à 9216 accélérateurs, fournissant environ 1,77 PB de HBM partagé et 9,6 Tb/s d'interconnexion pour « l'inférence et les services à très grande échelle ».
- Lancement simultané des instances Axion sur architecture Arm, la prévisualisation N4A et C4A Metal seront bientôt disponibles, en mettant l'accent sur le coût et l'efficacité énergétique en conjonction avec les clusters d'inférence.
II. Meta a investi 600 milliards de dollars aux États-Unis en trois ans, principalement dans les centres de données d'IA.
- Meta affirme qu'elle investira au moins 600 milliards de dollars aux États-Unis au cours des trois prochaines années dans les infrastructures et la création d'emplois, notamment dans plusieurs méga-centres de données d'IA.
- L'entreprise promeut simultanément le financement de projets de très grande envergure et la construction de parcs industriels distribués afin de répondre à la demande croissante en puissance de calcul pour l'IA grâce à une « expansion préventive ».
- La direction a déclaré que les objectifs sont alignés sur la feuille de route à long terme de « General Intelligence » et que les dépenses d'investissement « augmenteront considérablement » à partir de 2026.
III. L’UE prévoit de « ralentir » sa législation sur l’IA, en introduisant une période de transition et des exemptions.
- Selon un projet de document de la Commission européenne divulgué par les médias, un délai de grâce allant jusqu'en août 2027 est proposé pour l'enregistrement et les sanctions des systèmes d'IA à haut risque.
- Des exemptions d'enregistrement dans les bases de données seront accordées pour les scénarios d'IA à haut risque qui n'effectuent que des tâches « procédurales/limitées » ; les obligations d'étiquetage du contenu de l'IA seront mises en œuvre par étapes.
- La proposition finale devrait être soumise le 19 novembre, mais elle pourrait encore être ajustée au cours du processus, en fonction des exigences de grandes plateformes telles qu'Apple et Meta, ainsi que d'entreprises industrielles européennes.
IV. Anthropic annonce l'ouverture de nouveaux bureaux à Paris et à Munich, renforçant ainsi sa présence dans la zone EMEA.
- Confirmation officielle de l'ouverture de bureaux en France et en Allemagne, poursuivant ainsi l'expansion de la présence européenne après Londres, Dublin et Zurich.
- Au cours de l'année écoulée, le chiffre d'affaires de la zone EMEA a progressé à un taux annuel de plus de 9 fois, et le nombre de clients régionaux majeurs a été multiplié par plus de 10, couvrant les secteurs de la fabrication, de la pharmacie et de la finance.
- La société a déclaré qu'elle allait davantage localiser ses fonctions de recherche, d'ingénierie, commerciales et de coopération politique, et entreprendre l'expansion de l'approvisionnement en TPU précédemment convenue avec Google Cloud.
V. Wuzhen : Le projet de l'Université Tsinghua et de Zhipu intitulé « Technologies clés et application à grande échelle du modèle GLM » a remporté le prix de la technologie de pointe.
- Le projet propose une solution systématique en termes d'architecture de pré-entraînement, d'adaptation de la puce et d'alignement multimodal, et affirme être compatible avec plus de 40 puces d'IA.
- Le volume quotidien d'appels API des plateformes concernées atteint le niveau de « billions de mots », couvrant plus de 20 secteurs tels qu'Internet et la finance, et plus de 40 modèles open source.
- Cette réalisation a été sélectionnée parmi les 17 projets annuels pour le prix de la technologie de pointe lors de la Conférence mondiale sur l'Internet de 2025.
VI. Baidu remporte à nouveau le prix Wuzhen des technologies de pointe pour sa « technologie humaine numérique hautement réaliste, collaborative et multimodale pilotée par script »
- C’est la troisième année consécutive qu’une entreprise spécialisée en IA remporte ce prix, grâce à des technologies clés couvrant la planification multimodale, l’interaction en temps réel et la synthèse vidéo longue.
- Selon des sources officielles, cette technologie a permis de créer plus de 100 000 humains numériques et a été mise en œuvre dans le commerce électronique, l’éducation, le droit et d’autres secteurs, réduisant considérablement le coût de la diffusion en direct.
- Les récompenses continues ont renforcé ses capacités d'industrialisation et de production de contenu dans la pile technologique « Wenxin ».
VII. Le robot humanoïde IRON de XPeng suscite une vive discussion ; l'entreprise répond à deux reprises aux doutes par des « preuves d'elle-même ».
- Du 5 au 7 novembre, XPeng a présenté publiquement à deux reprises la structure interne d'IRON lors de sa journée technologique et de sa conférence de presse, notamment en ouvrant le couvercle du pied alors qu'il était sous tension.
- La déclaration officielle souligne l'utilisation de conceptions telles qu'une colonne vertébrale humanoïde, des muscles bioniques et une peau flexible entièrement recouverte, dans le but d'atteindre une production de masse d'ici 2026.
- Dans le même temps, la capacité « IA physique » de deuxième génération du VLA a été lancée, affirmant que le kilométrage moyen de prise en charge sur des routes complexes a été considérablement amélioré, formant un récit collaboratif véhicule/machine/aéronef.
8. China Mobile publie la version 2026 du livre blanc sur les téléphones mobiles 5G, établissant une exigence obligatoire de « SMS BeiDou ».
- Il est proposé qu'à compter du 1er juillet 2026, les nouveaux téléphones mobiles dont le prix est de 4 000 yuans et plus doivent prendre en charge nativement les SMS Beidou ; chaque marque doit disposer d'au moins un modèle prenant en charge la fusion SMS Beidou + géolocalisation et être distribué à grande échelle.
- Il a été révélé qu'à ce jour, plus de 2,65 millions de stations de base 5G ont été ouvertes, couvrant 96 % de la population, et qu'il y a plus de 599 millions d'utilisateurs de la 5G.
- Avec le développement de l'eSIM, des communications par satellite et de la 5G-A, la collaboration entre terminaux et réseaux imposera des « contraintes matérielles » sur les capacités de connectivité et de perception de position des terminaux IA.
Foire aux questions (Q&R)
Q : Quel est le rapport de performance entre Ironwood et Nvidia Blackwell ?
A: Les indicateurs disponibles publiquement montrent que la puissance de calcul FP8 monocœur d'Ironwood est d'environ 4,6 PFLOPS, avec un maximum de 9216 interconnexions de cœurs par Pod et 1,77 PB de HBM partagé, ce qui indique des services d'« inférence à très grande échelle » et à haute concurrence ; il est compétitif avec les références haut de gamme de Blackwell au même niveau de précision, en se concentrant sur les clusters à grande échelle et la collaboration au niveau système.
Q : Où Meta a-t-elle dépensé ses 600 milliards de dollars, et sur quelle période ?
A : Le plan couvre les parcs de centres de données, les installations d'alimentation électrique et de refroidissement, les équipements de réseau et informatiques, ainsi que les emplois aux États-Unis, sur une période de trois ans, en plus des engagements de financement de projets à grande échelle et des engagements d'investissement au niveau de l'État déjà signés.
Q : Pourquoi l’UE envisage-t-elle de ralentir la mise en œuvre de sa loi sur l’IA ? Quelles conséquences cela aura-t-il pour les entreprises ?
A: Les grandes entreprises et les organisations industrielles européennes et américaines estiment que les coûts de mise en œuvre sont élevés, l'exécution complexe et le délai très court. Le comité prévoit de réduire les obstacles à la conformité grâce à une période de transition et une exemption d'enregistrement. À court terme, cela profitera aux systèmes existants dans les situations à haut risque et à l'étiquetage du contenu de l'AIGC, mais à long terme, les exigences formelles de conformité devront toujours être respectées.
Q : Le prix « Technologie de pointe » de Wuzhen est décerné coup sur coup à des modèles de grande taille et à des humains numériques. Quelles en sont les implications industrielles ?
A : La concentration des récompenses reflète un passage des « indicateurs théoriques » aux « capacités d'ingénierie et de service reproductibles ». GLM met l'accent sur l'entraînement inter-puces et la robustesse multimodale, tandis que Digital Human met l'accent sur l'interaction à long terme et l'efficacité de la production de contenu, deux facteurs qui stimulent l'offre à grande échelle d'applications d'IA.