Retour à Point d’information sur l’IA
Actualités IA en continu : Lancement d’Ironwood, ouverture du sommet de Wuzhen, l’UE évalue le rythme de son projet de loi sur l’IA

Actualités IA en continu : Lancement d’Ironwood, ouverture du sommet de Wuzhen, l’UE évalue le rythme de son projet de loi sur l’IA

Point d’information sur l’IA Admin 63 vues

Au cours des dernières 24 heures (7 novembre), Google Cloud a lancé sa nouvelle génération de TPU Ironwood et a divulgué des indicateurs de performance pour ses clusters à grande échelle ; en Europe, des informations ont fait état d'une réévaluation du rythme de mise en œuvre de la législation sur l'IA ; en Chine, le Sommet de Wuzhen de la Conférence mondiale sur l'Internet et l'exposition « La lumière d'Internet » ont ouvert leurs portes, iFlytek a lancé le modèle de données massives d'inférence profonde Spark X1.5, et XPeng a lancé son modèle VLA de deuxième génération et a précisé son calendrier de production et de déploiement à grande échelle.

I. Google annonce l'intégration d'Ironwood TPU dans Google Analytics, repoussant ainsi les limites de la puissance de calcul pour l'entraînement et l'inférence.

  1. Annoncé le 7 novembre : Ironwood offre environ 10 fois les performances de pointe du TPU v5p et plus de 4 fois les performances monopuce du v6e en matière d'entraînement et d'inférence.
  2. Un seul « SuperPod » peut être étendu jusqu'à 9216 puces, formant environ 1,77 PB de HBM partagé et 9,6 Tbit/s de bande passante d'interconnexion, prenant en charge une architecture unifiée allant de l'apprentissage par renforcement à l'inférence en ligne massive.
  3. Google indique qu'Anthropic aura accès à « jusqu'à 1 million de TPU » et collaborera avec Ironwood pour prendre en charge des services à grande échelle pour des modèles de pointe tels que Claude, marquant une diversification supplémentaire de son paysage de puissance de calcul IA.

II. L’UE envisage une suspension « ciblée » de la mise en œuvre de certaines dispositions de la loi sur l’IA.

  1. Le 7 novembre, plusieurs médias ont cité des sources indiquant qu'après avoir communiqué avec les États-Unis et les principales entreprises technologiques, la Commission européenne discutait du calendrier de mise en œuvre des ajustements apportés à certaines dispositions, et que la décision finale devrait être prise aux alentours du 19 novembre.
  2. L’UE a réitéré son soutien aux objectifs et aux principes du projet de loi sur l’IA, en privilégiant l’optimisation du calendrier et du rythme de mise en œuvre plutôt que de « repartir de zéro ».
  3. Si ces ajustements sont mis en œuvre, ils auront une incidence sur la feuille de route de conformité des systèmes à haut risque et sur le rythme de la transformation technologique des entreprises. Ces dernières doivent être attentives aux détails et aux modalités de la période de transition.

III. Anthropic poursuit son expansion en Europe, en ouvrant des bureaux à Paris et à Munich.

  1. Le 7 novembre, il a été officiellement annoncé que l'entreprise allait ouvrir des bureaux en France et en Allemagne, avec une équipe complète allant de la R&D aux ventes et aux opérations, afin de renforcer ses capacités de prestation locales dans la zone EMEA.
  2. La société a déclaré que son activité européenne a vu son chiffre d'affaires annuel augmenter de plus de neuf fois au cours de l'année écoulée et qu'elle a établi des partenariats solides avec des clients régionaux (y compris des géants de l'automobile et de la vente au détail).
  3. Grâce à ses ressources TPU massives et à sa stratégie multicloud, la disponibilité et la rapidité des services modèles sur le marché européen devraient encore s'améliorer.

IV. Les États-Unis prévoient d'empêcher Nvidia de vendre des puces d'IA « réduites » à la Chine.

  1. Un rapport du 7 novembre indiquait que le gouvernement américain envisageait de restreindre la vente à la Chine d'une version allégée d'une puce d'intelligence artificielle, nom de code B30A. Des échantillons de cette puce avaient déjà été présentés à certains clients.
  2. Nvidia a répondu qu'elle ne détenait actuellement « aucune part de marché sur le marché chinois des centres de données et n'était pas incluse dans les directives ».
  3. Du côté chinois, des directives récentes exigent également que les projets financés par le gouvernement privilégient les « puces nationales », et cette concurrence à deux vitesses accélère la localisation de la chaîne d'approvisionnement en matériel d'IA.

V. OpenAI précise : les discussions avec le gouvernement portaient sur des garanties de prêts pour les « usines de puces », et non pour les centres de données.

  1. Le 6 novembre (7 novembre, heure de Pékin), OpenAI a déclaré que la garantie de prêt fédérale en discussion se concentre sur la « fabrication de puces » et ne vise pas à fournir des garanties pour les centres de données auto-construits.
  2. D'après les déclarations publiques de l'entreprise, l'investissement de capitaux prévu pour les huit prochaines années s'élève à environ 1 400 milliards de dollars américains, et le chiffre d'affaires annuel devrait dépasser 20 milliards de dollars américains. Parallèlement, l'entreprise explore un modèle de cloud IA basé sur la vente directe de puissance de calcul.
  3. La Maison Blanche a déclaré qu'elle ne fournirait pas d'aide à l'ensemble du secteur et que l'expansion de l'infrastructure d'IA reposerait davantage sur les mécanismes de marché et les structures de capital multilatérales.

VI. Le Sommet de Wuzhen de la Conférence mondiale sur l'Internet s'ouvre, avec l'exposition « Lumière d'Internet » axée sur « Intelligence artificielle + ».

  1. L'exposition a ouvert ses portes le 6 novembre sur le thème « Symbiose avec l'IA, avenir intelligent ». Elle proposait sept espaces d'exposition thématiques et réunissait 670 entreprises, présentes en ligne et en présentiel, présentant plus de 1 000 technologies et produits d'IA.
  2. Le forum principal du sommet s'est concentré sur des sujets tels que les modèles de pointe en matière de mégadonnées, la gouvernance des données, l'IA digne de confiance et la mise en œuvre industrielle, servant de fenêtre sur la synergie entre l'application et la gouvernance de l'IA en Chine.
  3. La conférence se déroulera jusqu'au 9 novembre et devrait permettre de mettre en lumière un certain nombre de coopérations industrielles et de réalisations technologiques.

VII. iFlytek publie le modèle d'inférence profonde Spark X1.5

  1. Publié le 6 novembre : Selon l'entreprise, avec une échelle de paramètres plus petite, les performances globales sont « comparables aux grands modèles internationaux courants », et les performances globales atteindraient « plus de 95 % de celles de GPT-5 » (cette affirmation nécessite une vérification supplémentaire par des benchmarks tiers).
  2. Sur le plan technique, on affirme que « l'efficacité de l'entraînement par renforcement de la longue chaîne de pensée » est passée d'environ 30 % à plus de 84 %, et que l'efficacité de l'entraînement complet du MoE (Expert Hybrid) a été considérablement améliorée.
  3. Côté déploiement, il est souligné qu’« un serveur standard Ascend peut être déployé », mettant en avant la puissance de calcul nationale et l’écosystème matériel et logiciel intégré.

8. XPeng Technology lance le modèle VLA de deuxième génération et précise le calendrier de déploiement du véhicule.

  1. Sortie le 7 novembre : La VLA de deuxième génération produit une « vision → action » de bout en bout, réduisant le lien linguistique intermédiaire ; le kilométrage moyen de prise en charge du « NGP de petite route » pour les petites routes complexes a été augmenté d'environ 13 fois.
  2. Calendrier de mise en œuvre : L’expérience « Co-création pionnière » sera lancée le mois prochain et le déploiement complet auprès des utilisateurs débutera au premier trimestre de l’année prochaine, en même temps que le modèle Ultra.
  3. La collaboration avec Volkswagen progresse en parallèle, la puce d'IA Turing de Xpeng ayant décroché un contrat avec Volkswagen, rationalisant davantage le processus du véhicule intelligent, du modèle à la puissance de calcul.

9. Ant Group a présenté pour la première fois à Wuzhen sa « Famille de grands modèles Braille » et a remporté un prix lors de la conférence.

  1. Les 6 et 7 novembre : L’ensemble de la famille de modèles Behring sera présenté pour la première fois. Dix-huit modèles, couvrant le langage, la pensée et le multimodal, ont été dévoilés. Il est affirmé que deux modèles à mille milliards de paramètres (Ling-1T et Ring-1T) ont atteint un niveau de performance de pointe dans le domaine des logiciels libres (notamment une performance de niveau « médaille d’argent » aux IMO2025, etc., d’après les médias et les experts techniques présents sur place).
  2. Côté scène, le gestionnaire de santé IA AQ (qui prétend pouvoir se connecter aux ressources de plus de 5 000 établissements médicaux à l'échelle nationale), le robot incarné Robbyant-R1 et l'interaction de confiance gPass ont été présentés.
  3. Ant Computing a remporté le « Prix de la contribution exceptionnelle (catégorie potentiel de croissance) » lors de la Conférence mondiale sur l'Internet, soulignant la valeur industrielle de l'informatique privée et de la circulation de données de confiance.

10. Un chercheur de DeepSeek prend la parole publiquement à Wuzhen : il exprime sa prudence quant à l’impact social à long terme de l’IA.

  1. Lors de l'événement du 7 novembre, un chercheur principal de DeepSeek a déclaré lors du « Dialogue des Six Petits Dragons de Wuzhen » qu'il avait une attitude positive à l'égard de l'amélioration de l'efficacité à court terme de l'IA, mais qu'il restait prudent quant à son impact à moyen et long terme sur l'emploi et la société.
  2. Depuis que DeepSeek a acquis une certaine notoriété en début d'année grâce à ses modèles performants et économiques, l'entreprise s'est faite relativement discrète. Cette déclaration a relancé le débat sur le lien entre « bénéfices technologiques et résilience sociale ».
  3. Cet incident reflète également la stratégie et la pression de l’écosystème local de l’IA en Chine, qui poursuit trois voies parallèles : « les modèles open source, l’adaptation de la puissance de calcul nationale et l’application industrielle ».

Foire aux questions (Q&R)

Q : Quels sont les indicateurs clés de performance et le délai de commercialisation du TPU Ironwood ?

A : Le 7 novembre, l'entrée en phase de disponibilité générale a été annoncée, et le déploiement auprès des clients est prévu dans les semaines à venir. Ses performances sont environ 10 fois supérieures aux performances maximales de la v5p, et plus de 4 fois supérieures aux performances d'entraînement et d'inférence sur une seule puce de la v6e ; un seul Pod peut gérer jusqu'à 9 216 puces, avec environ 1,77 Po de mémoire HBM partagée et une interconnexion de 9,6 Tbit/s.

Q : Le projet de loi européen sur l'IA va-t-il vraiment être « suspendu » ? Quel sera l'impact à court terme ?

A : Le report actuel est un « report ciblé » évoqué dans les discussions internes et les médias, et non un arrêt définitif ; l’UE maintient son soutien aux objectifs du projet de loi. À court terme, l’impact concerne principalement le calendrier de mise en conformité et les dispositions transitoires relatives aux systèmes et modèles sous-jacents à haut risque ; les entreprises doivent suivre attentivement les déclarations publiques officielles prévues entre mi-novembre et fin novembre.

Q : À quoi fait exactement référence le montant de « 1,4 billion de dollars » auquel OpenAI fait référence ?

A : La déclaration publique de l'entreprise porte sur « l'ampleur de son engagement en matière de capitaux au cours des huit prochaines années », couvrant les investissements à long terme dans la puissance de calcul et l'écosystème des puces en amont ; dans le même temps, elle a précisé qu'elle n'a pas sollicité de garanties de prêt fédérales pour les centres de données et que l'accent est mis sur la discussion avec le gouvernement des plans de renforcement de la fabrication et de la chaîne d'approvisionnement des puces.

Q : Quand la deuxième génération du XPeng VLA sera-t-elle disponible ? Quelles sont les améliorations ?

A : Le calendrier officiel prévoit que la co-création pionnière débutera en décembre et que le déploiement complet aura lieu avec les modèles Ultra au premier trimestre 2026 ; le kilométrage moyen de reprise en main dans des scénarios routiers complexes sera multiplié par environ 13 et les nouvelles fonctionnalités incluent la « conduite assistée automatique sans navigation ».

Q : Quelles modifications techniques ont été apportées à l'iFlytek Starfire X1.5 « Deep Inference » ?

A : L'entreprise affirme que l'efficacité de l'apprentissage par renforcement à longue chaîne a été considérablement améliorée (environ 30 % → 84 % et plus), que l'efficacité de l'entraînement du lien MoE a été accrue et souligne sa capacité de déploiement sur la plateforme nationale Ascend ; cependant, le classement précis des performances globales par rapport aux principaux modèles internationaux nécessite encore des benchmarks tiers et des évaluations publiques.

Analyse des performances de Google TPUIronwood Taille et bande passante du SuperPod Ironwood Google Cloud annonce la mise à disposition d'un million de TPU. Anthropic bénéficie d'une prise en charge allant jusqu'à un million de TPU. Réévaluation du rythme de mise en œuvre de la loi européenne sur l'IA Attention portée à la période de transition de conformité des systèmes à haut risque L'expansion européenne d'Anthropic comprend Paris et Munich. Modèle européen de localisation : livraison et respect des délais Les États-Unis prévoient de bloquer la vente de la puce B30A de Nvidia à la Chine. La Chine privilégie le développement de puces produites localement. OpenAI clarifie les conditions de garantie de prêt pour son usine de semi-conducteurs Interprétation de l'engagement de capital de 1,4 billion de yuans sur huit ans Exploration du modèle commercial de la vente directe de puissance de calcul IA dans le cloud Sommet de Wuzhen et Salon de la Lumière d'Internet L'exposition est axée sur l'intelligence artificielle et l'industrie iFlytek Starfire X1.5 Deep Inference iFlytek affirme que ses performances sont comparables à celles des modèles internationaux les plus courants. Des raisonnements plus longs améliorent l'efficacité de l'apprentissage Un serveur de plateforme Ascend peut être déployé Le modèle VLA de deuxième génération de XPeng a été commercialisé et mis en circulation. Le kilométrage moyen de reprise en charge s'est amélioré sur les routes secondaires. Progrès dans la conduite autonome sans navigation Collaboration avec Volkswagen et désignation de puce d'IA Turing Exposition familiale de grande maquettes d'alouettes fourmilières Les Ling1T et Ring1T, dotés de milliards de paramètres, font leurs débuts. Assistant de santé IA AQ et interaction de confiance gPass L'importance du traitement des données et de leur circulation dans le respect de la vie privée devient de plus en plus évidente. DeepSeek réagit avec prudence concernant l'impact social Voie d'adaptation de la puissance de calcul domestique du modèle open source Réexamen du dividende de l'IA et de la résilience sociale Ironwood offre des performances dix fois supérieures à celles de v5p. Puce Pod9216 unique avec 1,77 PBHBM La bande passante d'interconnexion de 9,6 Tbit/s prend en charge une architecture unifiée De l'apprentissage par renforcement à l'inférence en ligne massive La Commission européenne peut apporter des ajustements ciblés aux dispositions. Les entreprises doivent prêter attention aux détails et au rythme de la mise en œuvre. La politique américaine et le jeu de la substitution intérieure chinoise Paysage diversifié de la puissance de calcul et concurrence dans l'écosystème du cloud Observation de la fenêtre d'opportunité pour la mise en œuvre intégrée de grands modèles Gouvernance des données d'IA fiable et collaboration industrielle Conférence de Wuzhen : Sécurité et applications de l’IA en harmonie Nvidia ne détient aucune part de marché dans les centres de données chinois. Nvidia précise que ses prévisions financières n'ont pas été incluses. Points clés de la conformité et de la gestion des risques liés à l'IA en entreprise L'événement « La Lumière d'Internet » a présenté des milliers de produits d'IA. Intégration profonde du commerce de détail automobile dans la région EMEA La stratégie multicloud d'Anthropic améliore la disponibilité. L'évaluation du modèle industriel nécessite toujours une vérification par un tiers Parcours visuel de conduite intelligent de bout en bout Rythme et perspectives des investissements dans les infrastructures d'IA

Outils Recommandés

Plus