DeepSeek V4 Huawei Shang Chip 情報によると、DeepSeekはHuawei社の最新の昇天プラットフォーム上でV 4を実行させるために、リリース時間を延期し、Huawei社とCambrianで低レベルモジュールの一部を書き換えました。今後数週間で予定通りにリリースされれば、国内のAIチップが最先端の大型モデルをキャッチできるかどうかを直接テストすることになります。
によると、DeepSeekはハードウェアとソフトウェアの適応を行うために数ヶ月を費やした。目標は単純な移行ではなく、Huawei社の最新のチップ上でV 4を安定的に動作させることである。
この調整は、業界の一般的なプロセスを破壊しました。メーカーは通常、ビッグモデルがリリースされる前にNvidiaやAMDなどのチップ企業に早期アクセスを提供し、DeepSeekはこの機会をHuaweiとCambrianに優先しています。
手がかりによると、Huawei社が今年 3 月に発表したSheng950 PRはAtlas 350アクセラレータカードに搭載されており、シングルカードの計算能力はH 20の2.87 倍に達し、112GBのビデオメモリ、1.4 TB/sのメモリ帯域幅を備えている。
さらに重要なのは、 FP 4 低精度推論をサポートしていることです。大規模なモデルの展開では、FP4はメモリの占有率を大幅に圧縮し、同じハードウェアがより大きなパラメータモデルやより高い同時要求を処理できるようにします。コストは600Wで、H20の約2倍です。英国のフィナンシャル·タイムズ紙は以前、DeepSeekがHuawei社を使用してフォローアップモデルを訓練しようとしたが、安定性、相互接続速度、ソフトウェアツールチェーンの問題に遭遇し、最終的にはNvidiaに戻ってトレーニングを行い、国内のチップが推論タスクをより多く引き受けることを報告した。
V 4が昇天に直接実行されることができれば、少なくとも過去に適応が実質的に進歩したことを示しています。中国のAI業界が本当に検証したいのは、“完全な代替”ではなく、まず推論リンクを使用可能、展開可能、複製可能な国産案にすることである。
国内計算力がモデルエントリを争い始め
開発者にとって、この問題の意義は、フロンティアモデルの将来は海外計算力に縛られる必要はないということです。V 4が長いコンテキストとプログラミングタスクでClaude、ChatGPTに近い限り、国産チップはもはや単なる選択肢ではなく、主流の展開リストに入るでしょう。
DeepSeek V 4がこのステップを実行すれば、国内AIチップの競争ポイントは“できるか”から“高付加価値モデルサービスを維持できるか”にシフトする。これは、単一のパラメータブレークスルーよりも業界の現実に近いです。