Retour à Point d’information sur l’IA
Actualités IA en continu : Le projet de loi européen sur l’IA pourrait ralentir ; les prix Wuzhen partageront la scène avec Google Ironwood.

Actualités IA en continu : Le projet de loi européen sur l’IA pourrait ralentir ; les prix Wuzhen partageront la scène avec Google Ironwood.

Point d’information sur l’IA Admin 69 vues

Ces dernières 24 heures (7-8 novembre), des informations en provenance d'Europe ont fait état d'un possible ralentissement de la mise en œuvre de la réglementation sur l'IA ; les géants technologiques américains ont continué d'investir massivement dans les infrastructures d'IA à grande échelle et d'accélérer leur expansion internationale ; parallèlement, le Sommet de Wuzhen a annoncé une série de prix et de progrès pour le secteur, et XPeng a publiquement « démonté » son robot humanoïde afin de clarifier les controverses. La dynamique en Chine et en Amérique du Nord/Europe est globalement similaire.

I. Google lance Ironwood TPU, marquant le début officiel de « l'ère de l'inférence »

  1. Google a annoncé que son TPU Ironwood de septième génération sera largement disponible dans les semaines à venir, revendiquant une amélioration des performances de pointe de 10 fois par rapport au TPU v5p et une amélioration des performances monocœur de 4 fois par rapport au v6e, ciblant l'entraînement à grande échelle et l'inférence à faible latence.
  2. Un seul Pod peut évoluer jusqu'à 9216 accélérateurs, fournissant environ 1,77 PB de HBM partagé et 9,6 Tb/s d'interconnexion pour « l'inférence et les services à très grande échelle ».
  3. Lancement simultané des instances Axion sur architecture Arm, la prévisualisation N4A et C4A Metal seront bientôt disponibles, en mettant l'accent sur le coût et l'efficacité énergétique en conjonction avec les clusters d'inférence.

II. Meta a investi 600 milliards de dollars aux États-Unis en trois ans, principalement dans les centres de données d'IA.

  1. Meta affirme qu'elle investira au moins 600 milliards de dollars aux États-Unis au cours des trois prochaines années dans les infrastructures et la création d'emplois, notamment dans plusieurs méga-centres de données d'IA.
  2. L'entreprise promeut simultanément le financement de projets de très grande envergure et la construction de parcs industriels distribués afin de répondre à la demande croissante en puissance de calcul pour l'IA grâce à une « expansion préventive ».
  3. La direction a déclaré que les objectifs sont alignés sur la feuille de route à long terme de « General Intelligence » et que les dépenses d'investissement « augmenteront considérablement » à partir de 2026.

III. L’UE prévoit de « ralentir » sa législation sur l’IA, en introduisant une période de transition et des exemptions.

  1. Selon un projet de document de la Commission européenne divulgué par les médias, un délai de grâce allant jusqu'en août 2027 est proposé pour l'enregistrement et les sanctions des systèmes d'IA à haut risque.
  2. Des exemptions d'enregistrement dans les bases de données seront accordées pour les scénarios d'IA à haut risque qui n'effectuent que des tâches « procédurales/limitées » ; les obligations d'étiquetage du contenu de l'IA seront mises en œuvre par étapes.
  3. La proposition finale devrait être soumise le 19 novembre, mais elle pourrait encore être ajustée au cours du processus, en fonction des exigences de grandes plateformes telles qu'Apple et Meta, ainsi que d'entreprises industrielles européennes.

IV. Anthropic annonce l'ouverture de nouveaux bureaux à Paris et à Munich, renforçant ainsi sa présence dans la zone EMEA.

  1. Confirmation officielle de l'ouverture de bureaux en France et en Allemagne, poursuivant ainsi l'expansion de la présence européenne après Londres, Dublin et Zurich.
  2. Au cours de l'année écoulée, le chiffre d'affaires de la zone EMEA a progressé à un taux annuel de plus de 9 fois, et le nombre de clients régionaux majeurs a été multiplié par plus de 10, couvrant les secteurs de la fabrication, de la pharmacie et de la finance.
  3. La société a déclaré qu'elle allait davantage localiser ses fonctions de recherche, d'ingénierie, commerciales et de coopération politique, et entreprendre l'expansion de l'approvisionnement en TPU précédemment convenue avec Google Cloud.

V. Wuzhen : Le projet de l'Université Tsinghua et de Zhipu intitulé « Technologies clés et application à grande échelle du modèle GLM » a remporté le prix de la technologie de pointe.

  1. Le projet propose une solution systématique en termes d'architecture de pré-entraînement, d'adaptation de la puce et d'alignement multimodal, et affirme être compatible avec plus de 40 puces d'IA.
  2. Le volume quotidien d'appels API des plateformes concernées atteint le niveau de « billions de mots », couvrant plus de 20 secteurs tels qu'Internet et la finance, et plus de 40 modèles open source.
  3. Cette réalisation a été sélectionnée parmi les 17 projets annuels pour le prix de la technologie de pointe lors de la Conférence mondiale sur l'Internet de 2025.

VI. Baidu remporte à nouveau le prix Wuzhen des technologies de pointe pour sa « technologie humaine numérique hautement réaliste, collaborative et multimodale pilotée par script »

  1. C’est la troisième année consécutive qu’une entreprise spécialisée en IA remporte ce prix, grâce à des technologies clés couvrant la planification multimodale, l’interaction en temps réel et la synthèse vidéo longue.
  2. Selon des sources officielles, cette technologie a permis de créer plus de 100 000 humains numériques et a été mise en œuvre dans le commerce électronique, l’éducation, le droit et d’autres secteurs, réduisant considérablement le coût de la diffusion en direct.
  3. Les récompenses continues ont renforcé ses capacités d'industrialisation et de production de contenu dans la pile technologique « Wenxin ».

VII. Le robot humanoïde IRON de XPeng suscite une vive discussion ; l'entreprise répond à deux reprises aux doutes par des « preuves d'elle-même ».

  1. Du 5 au 7 novembre, XPeng a présenté publiquement à deux reprises la structure interne d'IRON lors de sa journée technologique et de sa conférence de presse, notamment en ouvrant le couvercle du pied alors qu'il était sous tension.
  2. La déclaration officielle souligne l'utilisation de conceptions telles qu'une colonne vertébrale humanoïde, des muscles bioniques et une peau flexible entièrement recouverte, dans le but d'atteindre une production de masse d'ici 2026.
  3. Dans le même temps, la capacité « IA physique » de deuxième génération du VLA a été lancée, affirmant que le kilométrage moyen de prise en charge sur des routes complexes a été considérablement amélioré, formant un récit collaboratif véhicule/machine/aéronef.

8. China Mobile publie la version 2026 du livre blanc sur les téléphones mobiles 5G, établissant une exigence obligatoire de « SMS BeiDou ».

  1. Il est proposé qu'à compter du 1er juillet 2026, les nouveaux téléphones mobiles dont le prix est de 4 000 yuans et plus doivent prendre en charge nativement les SMS Beidou ; chaque marque doit disposer d'au moins un modèle prenant en charge la fusion SMS Beidou + géolocalisation et être distribué à grande échelle.
  2. Il a été révélé qu'à ce jour, plus de 2,65 millions de stations de base 5G ont été ouvertes, couvrant 96 % de la population, et qu'il y a plus de 599 millions d'utilisateurs de la 5G.
  3. Avec le développement de l'eSIM, des communications par satellite et de la 5G-A, la collaboration entre terminaux et réseaux imposera des « contraintes matérielles » sur les capacités de connectivité et de perception de position des terminaux IA.

Foire aux questions (Q&R)

Q : Quel est le rapport de performance entre Ironwood et Nvidia Blackwell ?

A: Les indicateurs disponibles publiquement montrent que la puissance de calcul FP8 monocœur d'Ironwood est d'environ 4,6 PFLOPS, avec un maximum de 9216 interconnexions de cœurs par Pod et 1,77 PB de HBM partagé, ce qui indique des services d'« inférence à très grande échelle » et à haute concurrence ; il est compétitif avec les références haut de gamme de Blackwell au même niveau de précision, en se concentrant sur les clusters à grande échelle et la collaboration au niveau système.

Q : Où Meta a-t-elle dépensé ses 600 milliards de dollars, et sur quelle période ?

A : Le plan couvre les parcs de centres de données, les installations d'alimentation électrique et de refroidissement, les équipements de réseau et informatiques, ainsi que les emplois aux États-Unis, sur une période de trois ans, en plus des engagements de financement de projets à grande échelle et des engagements d'investissement au niveau de l'État déjà signés.

Q : Pourquoi l’UE envisage-t-elle de ralentir la mise en œuvre de sa loi sur l’IA ? Quelles conséquences cela aura-t-il pour les entreprises ?

A: Les grandes entreprises et les organisations industrielles européennes et américaines estiment que les coûts de mise en œuvre sont élevés, l'exécution complexe et le délai très court. Le comité prévoit de réduire les obstacles à la conformité grâce à une période de transition et une exemption d'enregistrement. À court terme, cela profitera aux systèmes existants dans les situations à haut risque et à l'étiquetage du contenu de l'AIGC, mais à long terme, les exigences formelles de conformité devront toujours être respectées.

Q : Le prix « Technologie de pointe » de Wuzhen est décerné coup sur coup à des modèles de grande taille et à des humains numériques. Quelles en sont les implications industrielles ?

A : La concentration des récompenses reflète un passage des « indicateurs théoriques » aux « capacités d'ingénierie et de service reproductibles ». GLM met l'accent sur l'entraînement inter-puces et la robustesse multimodale, tandis que Digital Human met l'accent sur l'interaction à long terme et l'efficacité de la production de contenu, deux facteurs qui stimulent l'offre à grande échelle d'applications d'IA.

Analyse complète du lancement de Google TPUironwood Ironwood offre des performances dix fois supérieures à celles de v5p. Puce Pod9216 unique avec 1,77 PBHBM L'interconnexion de 9,6 Tbit/s prend en charge une inférence ultra-large Collaboration des systèmes de calcul en grappes à l'ère de l'inférence Meta investit 600 milliards de dollars dans l'infrastructure d'IA sur trois ans. Boom des investissements dans les méga-centres de données d'IA aux États-Unis Pré-expansion pour répondre à la courbe de demande en puissance de calcul Le rythme de mise en œuvre de la loi européenne sur l'IA pourrait ralentir. Période de transition et exemptions pour les systèmes d'IA à haut risque Optimisation des coûts et de la planification de la conformité d'entreprise Anthropic s'implante en Europe à Paris et à Munich. Croissance des revenus et des livraisons locales en EMEA Revue des prix des technologies de pointe du sommet de Wuzhen Interprétation de l'application à grande échelle du modèle linéaire généralisé de Tsinghua Zhipu Compatible avec plus de 40 solutions de puces IA Modèle open source GLM et échelle d'appels API Humain numérique hautement réaliste piloté par script Baidu Humain numérique multimodal, collaboratif, interaction en temps réel Commerce électronique, éducation, droit, mise en œuvre de l'humain numérique Démontage interne du robot humanoïde IRON de XPeng Colonne vertébrale humaine, muscles bioniques, peau flexible Calendrier de production de masse de robots pour 2026 XPeng lance sa VLA Physical AI de deuxième génération. Le kilométrage moyen de reprise des petites routes complexes a augmenté Récit intelligent collaboratif véhicule-aéronef Livre blanc de China Mobile sur la 5G à l'horizon 2026 Un incontournable pour les nouveaux téléphones aux alentours de 4000 yuans : Beidou SMS. Intégration du positionnement par SMS Beidou pour les expéditions à grande échelle 2,65 millions de stations de base 5G couvrent 96 % de la population. Communication par satellite eSIM et progrès de la 5G-A La collaboration de bout en bout au sein du réseau permet de développer de nouvelles capacités pour les terminaux d'IA. Comparaison de précision entre Ironwood et Blackwell, etc. Aperçu du système Arm N4A et C4A Metal de Google Architecture d'inférence d'entraînement unifiée et adaptation au RL Optimisation des coûts pour les services d'inférence à très haute concurrence La Commission européenne soumettra la version finale du projet à la mi-novembre. Concilier les exigences des plateformes et de l'industrie Points d'exemption d'enregistrement des bases de données d'IA à haut risque Les obligations d'étiquetage du contenu de l'AIGC seront mises en œuvre par étapes. Stratégie multicloud anthropique et expansion des TPU Les principaux clients européens des secteurs de la production, de la pharmacie et de la finance sont liés entre eux. Collaboration sur les applications et la gouvernance de l'IA à la conférence de Wuzhen Renforcement des capacités de production de contenu du système Wenxin Plus de 100 000 humains numériques ont été produits, réduisant ainsi les coûts de diffusion en direct. Amélioration de l'alignement multimodal et de la robustesse du modèle linéaire généralisé (GLM) Observation de la symétrie dynamique de l'IA en Chine, en Amérique du Nord et en Europe La concurrence en matière d'efficacité énergétique entre les fournisseurs de cloud pour les clusters d'inférence s'intensifie Localisation et concurrence dans la chaîne d'approvisionnement du matériel d'IA Résumé des faits marquants de l'IA dans le monde au cours des dernières 24 heures

Outils Recommandés

Plus