In den vergangenen 24 Stunden (7. November) veröffentlichte Google Cloud seine neue TPU-Generation Ironwood und gab Kennzahlen für große Cluster bekannt; in Europa gab es Berichte über eine Neubewertung des Umsetzungstempos der KI-Gesetzgebung; in China wurden der Wuzhen Summit der Weltinternetkonferenz und die Expo „Light of the Internet“ eröffnet, iFlytek veröffentlichte das Big-Data-Modell Spark X1.5 für Deep Inference, und XPeng veröffentlichte sein VLA-Modell der zweiten Generation und präzisierte seinen Zeitplan für Massenproduktion und Einsatz.
I. Google kündigt die Integration der Ironwood TPU in Google Analytics an und erhöht damit die Grenzen der Rechenleistung für Training und Inferenz.
- Am 7. November angekündigt: Ironwood bietet eine etwa 10-mal höhere Spitzenleistung als TPU v5p und eine mehr als 4-mal höhere Einzelchip-Leistung als v6e beim Training und der Inferenz.
- Ein einzelner „SuperPod“ kann auf bis zu 9216 Chips skaliert werden und bildet so etwa 1,77 PB gemeinsam genutzten HBM und 9,6 Tbps Verbindungsbandbreite. Dies unterstützt eine einheitliche Architektur von RL bis hin zu massiver Online-Inferenz.
- Google gibt an, dass Anthropic „auf bis zu 1 Million TPUs zugreifen“ und mit Ironwood zusammenarbeiten wird, um groß angelegte Dienste für hochmoderne Modelle wie Claude zu unterstützen, was eine weitere Diversifizierung seiner KI-Rechenleistungslandschaft bedeutet.
II. Die EU erwägt eine „gezielte“ Aussetzung der Umsetzung bestimmter Bestimmungen des KI-Gesetzes.
- Am 7. November berichteten mehrere Medien unter Berufung auf Quellen, dass die Europäische Kommission nach Gesprächen mit den Vereinigten Staaten und großen Technologieunternehmen den Umsetzungszeitplan für Anpassungen einiger Bestimmungen erörtert und die endgültige Entscheidung voraussichtlich um den 19. November fallen wird.
- Die EU bekräftigte ihre Unterstützung für die Ziele und Grundsätze des KI-Gesetzes und konzentrierte sich dabei auf die Optimierung der Umsetzungsreihenfolge und des Umsetzungstempos, anstatt „bei Null anzufangen“.
- Sollten die Anpassungen umgesetzt werden, werden sie sich auf den Fahrplan zur Einhaltung der Vorschriften für Hochrisikosysteme und das Tempo der technologischen Transformation von Unternehmen auswirken. Unternehmen müssen den Details und den Regelungen für den Übergangszeitraum besondere Aufmerksamkeit schenken.
III. Anthropic setzt seine Expansion in Europa fort und eröffnet Büros in Paris und München.
- Am 7. November wurde offiziell bekannt gegeben, dass das Unternehmen Büros in Frankreich und Deutschland einrichten wird, die ein komplettes Team von Forschung und Entwicklung bis hin zu Vertrieb und Betrieb umfassen, um seine lokalen Lieferkapazitäten in der EMEA-Region zu stärken.
- Das Unternehmen gab an, dass sich der Umsatz in seinem Europageschäft im vergangenen Jahr mehr als verneunfacht habe und dass es enge Partnerschaften mit regionalen Kunden (darunter auch Automobil- und Einzelhandelsriesen) aufgebaut habe.
- In Verbindung mit seinen massiven TPU-Ressourcen und seiner Multi-Cloud-Strategie dürfte die Verfügbarkeit und Pünktlichkeit der Modelldienste auf dem europäischen Markt weiter verbessert werden.
IV. Die USA planen, Nvidia den Verkauf von „abgespeckten“ KI-Chips an China zu untersagen.
- Einem Bericht vom 7. November zufolge plant die US-Regierung, den Verkauf einer verkleinerten Version eines KI-Chips mit dem Codenamen B30A an China einzuschränken. Einigen Kunden waren zuvor bereits Prototypen des Chips vorgeführt worden.
- Nvidia antwortete, dass es derzeit „keinen Marktanteil im chinesischen Rechenzentrumsmarkt hat und nicht in den Richtlinien enthalten ist“.
- Auf chinesischer Seite gibt es außerdem neuere Richtlinien, die vorschreiben, dass bei staatlich finanzierten Projekten „einheimische Chips“ Vorrang haben müssen. Dieser wechselseitige Wettbewerb beschleunigt die Lokalisierung der Lieferkette für KI-Hardware.
V. OpenAI stellt klar: Die Gespräche mit der Regierung betrafen Kreditgarantien für „Chipfabriken“, nicht für Rechenzentren.
- Am 6. November (7. November Pekinger Zeit) erklärte OpenAI, dass sich die zur Debatte stehende staatliche Kreditgarantie auf die „Chipherstellung“ konzentriert und keine Garantien für selbstgebaute Rechenzentren vorsieht.
- Laut den öffentlichen Mitteilungen des Unternehmens beläuft sich das Kapitalengagement in den nächsten acht Jahren auf rund 1,4 Billionen US-Dollar, und der jährliche Umsatz wird voraussichtlich 20 Milliarden US-Dollar übersteigen. Gleichzeitig prüft das Unternehmen das KI-Cloud-Modell des „Direktverkaufs von Rechenleistung“.
- Das Weiße Haus hat erklärt, dass es keine branchenweite Unterstützung geben wird und dass der Ausbau der KI-Infrastruktur stärker auf Marktmechanismen und multilaterale Kapitalstrukturen angewiesen sein wird.
VI. Die Weltinternetkonferenz Wuzhen Summit wird eröffnet, mit der Expo „Licht des Internets“, die sich auf „Künstliche Intelligenz +“ konzentriert.
- Die Expo wurde am 6. November unter dem Motto „KI-Symbiose, intelligente Zukunft“ eröffnet. Sie umfasste sieben thematische Ausstellungsbereiche, an denen 670 Unternehmen sowohl online als auch offline teilnahmen und mehr als 1.000 KI-Technologien und -Produkte präsentierten.
- Das Hauptforum des Gipfels konzentrierte sich auf Themen wie hochmoderne Big-Data-Modelle, Daten-Governance, vertrauenswürdige KI und industrielle Implementierung und diente als Fenster, um die Synergie zwischen KI-Anwendung und Governance in China zu beobachten.
- Die Konferenz dauert bis zum 9. November und wird voraussichtlich eine Reihe von Kooperationen und technologischen Errungenschaften der Industrie präsentieren.
VII. iFlytek veröffentlicht Spark X1.5 Deep Inference-Modell
- Veröffentlicht am 6. November: Laut Hersteller ist die Gesamtleistung bei kleinerem Parameterbereich „mit den gängigen internationalen Großmodellen vergleichbar“ und soll „mehr als 95 % von GPT-5“ erreichen (diese Aussage bedarf noch der Überprüfung durch unabhängige Benchmarks).
- Auf technischer Ebene wird behauptet, dass die Effizienz des Reinforcement Learning Trainings mit langen Denkketten von etwa 30 % auf über 84 % gesteigert wurde und die Effizienz des Full-Link-Trainings von MoE (Expert Hybrid) deutlich verbessert wurde.
- Auf der Bereitstellungsseite wird betont, dass „ein Ascend-Standardserver eingesetzt werden kann“, wobei die heimische Rechenleistung und das integrierte Hardware- und Software-Ökosystem hervorgehoben werden.
8. XPeng Technology bringt das große VLA-Modell der zweiten Generation auf den Markt und präzisiert den Zeitplan für den Fahrzeugeinsatz.
- Veröffentlicht am 7. November: Die VLA der zweiten Generation liefert durchgängige „Vision → Aktion“-Ausgaben und reduziert so die Zwischensprache; die durchschnittliche Übernahmedistanz von „Small Road NGP“ für komplexe kleine Straßen wurde um etwa das 13-fache erhöht.
- Implementierungsplan: Das „Pioneer Co-creation“-Erlebnis wird nächsten Monat eingeführt, und die vollständige Einführung für die Benutzer beginnt im ersten Quartal des nächsten Jahres zusammen mit dem Ultra-Modell.
- Die Zusammenarbeit mit Volkswagen schreitet parallel voran, wobei der Turing-KI-Chip von Xpeng einen Volkswagen-Auftrag sicherte und den Prozess der Entwicklung intelligenter Fahrzeuge vom Modell bis zur Rechenleistung weiter optimierte.
9. Die Ant Group präsentierte ihre „Braille Large Model Family“ zum ersten Mal in Wuzhen und gewann auf der Konferenz einen Preis.
- 6.–7. November: Die gesamte Behring-Modellfamilie wird erstmals präsentiert. 18 Modelle wurden veröffentlicht, die die Bereiche „Sprache, Denken und Multimodalität“ abdecken. Es wird behauptet, dass zwei Billionen-Parameter-Modelle (Ling-1T und Ring-1T) ein führendes Niveau im Open-Source-Bereich erreicht haben (einschließlich der „Silbermedaillen“-Leistung von IMO2025 usw., die alle auf Medienberichten und dem Feedback von technischem Personal vor Ort basieren).
- Auf der Bühnenseite wurden der KI-Gesundheitsmanager AQ (der nach eigenen Angaben in der Lage ist, sich mit Ressourcen von über 5.000 medizinischen Einrichtungen landesweit zu verbinden), der verkörperte Roboter Robbyant-R1 und die vertrauenswürdige Interaktionsplattform gPass vorgestellt.
- Ant Computing gewann auf der World Internet Conference den „Outstanding Contribution Award (Growth Potential Category)“, was den industriellen Wert von Privacy Computing und vertrauenswürdiger Datenzirkulation unterstreicht.
10. DeepSeek-Forscher spricht öffentlich in Wuzhen: Warnung vor den langfristigen sozialen Auswirkungen von KI.
- Bei der Veranstaltung am 7. November erklärte ein leitender Forscher von DeepSeek im Rahmen des „Six Little Dragons·Wuzhen Dialogue“, dass er der kurzfristigen Effizienzsteigerung durch KI positiv gegenüberstehe, jedoch hinsichtlich ihrer mittel- und langfristigen Auswirkungen auf Beschäftigung und Gesellschaft vorsichtig bleibe.
- Seit DeepSeek Anfang des Jahres mit seinen kostengünstigen und leistungsstarken Modellen an Popularität gewann, hat das Unternehmen relativ wenige öffentliche Auftritte absolviert. Diese Aussage hat eine erneute Diskussion über den Zusammenhang zwischen „technologischen Vorteilen und sozialer Resilienz“ ausgelöst.
- Der Vorfall spiegelt auch die Strategie und den Druck wider, dem Chinas lokales KI-Ökosystem bei der Verfolgung dreier paralleler Wege ausgesetzt ist: „Open-Source-Modelle, Anpassung an die heimische Rechenleistung und industrielle Anwendung“.
Häufig gestellte Fragen (FAQ)
F: Was sind die wichtigsten Leistungsindikatoren und die Markteinführungszeit für Ironwood TPU?
A: Am 7. November wurde bekannt gegeben, dass die allgemeine Verfügbarkeit (GA) erreicht wurde. Die offizielle Mitteilung besagt, dass die Auslieferung an Kunden in den kommenden Wochen erfolgen wird. Die Leistung ist etwa zehnmal höher als die Spitzenleistung von v5p und mehr als viermal höher als die Single-Chip-Trainings- und Inferenzleistung von v6e. Ein einzelner Pod kann bis zu 9216 Chips umfassen, mit ca. 1,77 PB gemeinsam genutztem HBM und einer Verbindungsgeschwindigkeit von 9,6 Tbps.
F: Wird das EU-KI-Gesetz tatsächlich „ausgesetzt“? Welche kurzfristigen Auswirkungen wird das haben?
A: Die aktuelle Verzögerung ist eine gezielte Verschiebung, die in internen Diskussionen und Medienberichten thematisiert wird, kein vollständiger Stopp; die EU unterstützt weiterhin die Ziele des Gesetzesentwurfs. Die kurzfristigen Auswirkungen betreffen hauptsächlich die Fristen für die Einhaltung der Vorschriften sowie Übergangsbestimmungen für Hochrisikosysteme und zugrunde liegende Modelle; Unternehmen sollten die offiziellen öffentlichen Erklärungen Mitte bis Ende November aufmerksam verfolgen.
F: Was genau sind die „1,4 Billionen Dollar“, auf die sich OpenAI bezieht?
A: In der öffentlichen Erklärung des Unternehmens heißt es „über den Umfang des Kapitalengagements in den nächsten acht Jahren“ und umfasst langfristige Investitionen in Rechenleistung und das vorgelagerte Chip-Ökosystem; gleichzeitig stellte das Unternehmen klar, dass es keine staatlichen Kreditgarantien für Rechenzentren beantragt hat und dass der Schwerpunkt auf Gesprächen mit der Regierung über Pläne zur Stärkung der Chipherstellung und der Lieferkette liegt.
F: Wann wird die zweite Generation des XPeng VLA verfügbar sein? Welche Verbesserungen gibt es?
A: Der offizielle Zeitplan sieht vor, dass die Pionier-Ko-Entwicklung im Dezember beginnt und die vollständige Einführung mit Ultra-Modellen im ersten Quartal 2026 erfolgen wird; die durchschnittliche Übernahme-Kilometerleistung in komplexen Straßenszenarien wird um etwa das 13-fache erhöht, und zu den neuen Funktionen gehört „automatisches assistiertes Fahren ohne Navigation“.
F: Welche technischen Änderungen wurden am iFlytek Starfire X1.5 "Deep Inference" vorgenommen?
A: Das Unternehmen behauptet, die Effizienz des Long-Chain Reinforcement Learning sei deutlich verbessert worden (ca. 30 % → 84 %+), die Trainingseffizienz der MoE-Verbindung sei erhöht worden, und betont die Einsatzfähigkeit auf der heimischen Ascend-Plattform; allerdings bedarf es für eine genaue Rangfolge der Gesamtleistung im Vergleich zu gängigen internationalen Modellen noch externer Benchmarks und öffentlicher Evaluierungen.