DeepSeek V3.1 オープンソース速報:Hugging Faceが128Kコンテキストで重みを増す

DeepSeekは、V3.1-Baseモデルの重みをHugging Faceに公開しており、直接ダウンロードして使用できます。多くのメディアはこれを「オープンソース」リリースと呼んでいました。ただし、現在のモデルカードは利用できず、ライセンスはマークされておらず、厳格な使用境界は依然として公式のフォローアップ指示に従う必要があります。オンラインサービスは V3.1 にアップグレードされ、コンテキスト長が 128K に拡張され、Web/アプリ/ミニプログラムは API との互換性を維持していると主張しています。

1. 重要な情報

リリース形式: Hugging Face は V3.1-Base 重み (安全テンソル) を提供し、ページには BF16 / F8_E4M3 / F32 をサポートし、さまざまな定量バージョンを提供することが示されています。
スケールパラメータ: ページには「モデルサイズ:685B パラメータ」が表示されます。
コンテキストの長さ: 複数のレポートと公式発表により、オンラインモデルが 128K コンテキストにアップグレードされ、API 呼び出し方法は変更されていないことが示されています。
アーキテクチャの背景: V3 シリーズは、DeepSeek の自社開発 MLA やその他のテクノロジーと組み合わせた MoE (Mixture-of-Experts) ルートです。 V3.1 これに基づいて、エンジニアリングとコンテキストの強化が行われます (公開資料とメディアの概要に従って)。
注: 現在の Hugging Face モデルカードの詳細フィールドと権限フィールドはありません。ダウンロードして商品化する前に、ライセンスと条件を確認する必要があります。

2. オープンソースアドレス(公式かつ権威ある入り口)

ハグフェイス · DeepSeek-V3.1-ベース:

https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

2、DeepSeek公式サイト(製品およびAPI):

https://www.deepseek.com/

3、DeepSeek-V3 GitHub (アーキテクチャと論文の背景リファレンス):

https://github.com/deepseek-ai/DeepSeek-V3

3. 可用性と展開の提案1

. ダウンロードとフォーマット: SafeTensors が推奨されます。 BF16またはFP8(F8_E4M3)の定量化されたバリアントをハードウェア別に選択します。

推論リソース: 685B (MoE 合計パラメータ) レベルのモデルには、高いビデオメモリ/分散推論が必要です。リソースが限られている場合は、最初に量子化またはクラウド推論を選択します。
コンテキスト戦略: 128K コンテキストは長いドキュメント/長いコードベースに適しており、無効なコンテキストインジェクションを減らすために、プロンプトプロジェクトを検索拡張 (RAG) と組み合わせる必要があります。
評価とグレースケール: まず、小さなサンプルベンチマーク (コード、検索、長い記事の要約) を使用して A/B を行い、速度とコストのしきい値を設定してから、本番環境に拡張します。

4. 典型的なアプリケーションシナリオ1

. 長い文書の理解とコンプライアンスの概要: 契約/年次報告書/技術ホワイトペーパーの 1 回限りのコンテキスト読み込みとセグメント化された推論。

コードエージェント: ツール呼び出しやテストフレームワークと組み合わせて、大規模なコードベースの読み取り、書き込み、再構築を行います。
エンタープライズ検索とナレッジアシスタント: ベクトル検索/RAG と組み合わせることで、より長いコンテキストを使用して、データベース間の要約と証拠チェーンの回答を行います。

5. リスクと境界1

. ライセンスが不明確: 現在、明確なライセンスフィールドはなく、商用利用はデフォルトで固く禁じられています。公式モデルカードとライセンスの更新を待ちます。

コンピューティング能力とコスト: MoE レベルのモデルには、依然として重要なメモリ/帯域幅要件があります。着陸の規模を決定する前に、TCOとスループットを評価します。
データコンプライアンス: 機密データは長いコンテキストで簡単に持ち運べるため、脱感作、グレーディング、アクセス制御、ログと有効期限の消去ポリシーの構成が必要です。

6. よくある質問

. V3.1は本当に「オープンソース」なのか?

現在、ウェイトは「オープンウェイト」で公開されている Hugging Face でダウンロードできます。ただし、モデルカードはまだ入手できず、ライセンスもマークされておらず、厳格なオープンソース/商用境界は公式ライセンスの対象でなければなりません。

オンライン版を体験し、APIを呼び出す場所はどこでできますか?

DeepSeek の公式 Web サイトでは Web/アプリ/ミニプログラムと API が提供されており、公式発表では V3.1 にアップグレードされ、API の互換性は維持されていると記載されています。

V3 との主な違いは何ですか?

公開情報は、「より長いコンテキスト (128K まで)」と「エンジニアリングの最適化と速度エクスペリエンスの向上」に焦点を当てています。基盤となるレイヤーは依然として V3 システムを継続しており、詳細なトレーニングおよび評価データは公式モデルカードによって補完される必要があります。

リソースが足りない場合に試すにはどうすればよいですか?

定量的な重みと雲の推論が優先されます。オフライン展開では、分散推論とハイエンド GPU に投資するかどうかを決定する前に、小さなサンプル評価を行うことができます。

関連記事

アルトマン氏は、OpenAIがGPT-6を加速していることを確認した:長期記憶とパーソナライゼーションを中核的な方向性として

ナノバナナはグーグルから来る可能性が高い:実測でLMArenaが人気、記者会見ウィンドウがロックされる

Mem0はエージェントと統合する価値がありますか? 長期記憶は役立ちますが、境界線を管理する必要があります

ヘイスタックはどのようなチームに適しているのでしょうか? むしろコンポジタブルなRAGエンジニアリングフレームワークのようなものです

おすすめツール