DeepSeek V4 se tourne vers Huawei Shengteng : la puce IA domestique inaugure un test de combat réel

Selon The Information, afin de faire fonctionner le V4 sur la dernière plate-forme ascendante de Huawei, DeepSeek a retarder la sortie et a réécrit certains modules sous-jacents avec Huawei et Cambrian. Si elle est publiée dans les prochaines semaines, cela testera directement si les puces d'IA domestiques peuvent attraper les grands modèles de pointe.

Pourquoi la date de sortie de V4 est-elle repoussée ?

Le message indique que DeepSeek a passé plusieurs mois à adapter le logiciel et le matériel, l'objectif n'est pas simplement de migrer, mais de rendre V4 stable sur la dernière puce Ascend de Huawei.

Cette mise à jour rompt avec les processus habituels de l'industrie Avant la sortie de grands modèles, les fabricants ouvrent généralement un accès anticipé à des sociétés de puces telles que Nvidia, AMD et d'autres pour l'optimisation, et DeepSeek donne la priorité à Huawei et à Cambrian.

Quel problème voulez-vous résoudre ?

Selon les indices, Huawei a présenté le ShengTeng 950PR en mars de cette année équipé de la carte d'accélération Atlas 350. La puissance de calcul de la carte unique est prétendue être 2,87 fois supérieure à celle du H20, équipée de 112 Go de mémoire graphique et de 14 To / s de bande passante de mémoire.

Plus important encore, il prend en charge le raisonnement de faible précision. Pour les grands déploiements de modèles, le FP4 réduit considérablement l'utilisation de la mémoire graphique, permettant au même matériel de gérer des modèles paramétriques plus grands ou des requêtes concurrentes plus élevées, au prix d'une consommation d'énergie de 600 W, soit environ deux fois celle du H20.

De l'entraînement bloqué à l'alternative de raisonnement

Le Financial Times a précédemment rapporté que DeepSeek avait essayé d'utiliser Huawei pour former le modèle de suivi, mais a rencontré des problèmes de stabilité, de vitesse d'interconnexion et de chaîne d'outils logiciels, et est finalement retourné à Nvidia pour la formation, et les puces nationales ont assumé plus de tâches de raisonnement.

Si V4 peut maintenant fonctionner directement sur Ascension, cela indique au moins que l'adaptation a fait des progrès substantiels au cours de la période passée. Ce que l'industrie chinoise de l'IA veut vraiment vérifier n'est pas un « remplacement complet », mais d'abord faire du lien de raisonnement une solution domestique utilisable, déployable et reproductible.

La puissance de calcul domestique commence à rivaliser pour l'entrée du modèle

Pour les développeurs, l'importance de cette chose est que les modèles de pointe ne peuvent pas nécessairement lier la puissance de calcul à l'étranger à l'avenir. Tant que V4 sera proche de Claude, ChatGPT sur les longs contextes et les tâches de programmation, les puces domestiques ne seront plus seulement une option, mais entreront dans la liste des déploiements courants.

DeepSeek V4 passe à travers cette étape, le point de compétition de la puce d'IA domestique passera de "peut-il le faire" à "peut-il soutenir un service de modèle à haute valeur". C'est plus proche de la réalité de l'industrie qu 'une percée de paramètre unique.

Pourquoi la date de sortie de V4 est-elle repoussée ?

Quel problème voulez-vous résoudre ?

De l'entraînement bloqué à l'alternative de raisonnement

La puissance de calcul domestique commence à rivaliser pour l'entrée du modèle

Articles connexes

Anthropic resserre les abonnements à Claude, les agents d'IA tels qu ' OpenClaw se tournent vers API Key

Bulletin d'information AI 24 heures : Qwen explose de nouveaux modèles, les agents augmentent le coût des jetons

Kimi K3 officiellement lancé : 2,8 trillions de paramètres misant sur des millions de contextes et un poids ouvert

Mistral Studio ajoute la gestion des versions de prompts : l’IA d’entreprise gère désormais les actifs comportementaux

Outils Recommandés

DeepSeek V4 se tourne vers Huawei Shengteng : la puce IA domestique inaugure un test de combat réel

Pourquoi la date de sortie de V4 est-elle repoussée ?

Quel problème voulez-vous résoudre ?

De l'entraînement bloqué à l'alternative de raisonnement

La puissance de calcul domestique commence à rivaliser pour l'entrée du modèle

Articles connexes

Anthropic resserre les abonnements à Claude, les agents d'IA tels qu ' OpenClaw se tournent vers API Key

Bulletin d'information AI 24 heures : Qwen explose de nouveaux modèles, les agents augmentent le coût des jetons

Kimi K3 officiellement lancé : 2,8 trillions de paramètres misant sur des millions de contextes et un poids ouvert

Mistral Studio ajoute la gestion des versions de prompts : l’IA d’entreprise gère désormais les actifs comportementaux

Outils Recommandés

Soumettre un outil IA

Veuillez confirmer les informations de soumission