2か月前、DeepSeekは実験モデルV3.2-Expをリリースし、ユーザーの再訪問を通じて様々なシナリオでV3.1-Terminusに劣らないことを確認し、DSAのスパースアテンションメカニズムの有効性を検証しました。 DeepSeek-V3.2およびDeepSeek-V3.2-Specialeの最新公式バージョンが現在利用可能となり、V3.2は公式ウェブサイト、アプリ、API上でV3.2-Expを完全に置き換え、デフォルトサービスモデルとしてSpeciale版はコミュニティ評価と研究のための一時的なAPIサービスとして開放されています。
関係者によると、V3.2の目標は推論能力と出力の長さのバランスを取ることで、Q&Aや一般エージェントなどの日常的なシナリオに適したもので、公開推論ベンチマークでGPT-5のレベルに達することであり、これはGemini-3.0-Proよりわずかに低く、出力長と計算負荷がKimi-K2-Thinkingよりも抑制されている。 V3.2-Specialeは長期的思考能力を大幅に強化し、DeepSeek-Math-V2の定理証明能力を統合しています。IMO、CMO、ICPC World finals、IOI 2025で金メダルを獲得し、ICPCとIOIの成績は人間プレイヤーの中でそれぞれ2位と10位に近い成績を収めました。 このモデルは複雑な推論タスクに特化しており、トークン消費量が大幅に増加し、現在は思考モードの対話のみをサポートし、ツール呼び出しには開かれていません。最大出力長は128Kです。
エージェント用途の観点から、DeepSeek-V3.2は「思考」をツールコールに直接統合した初のモデルとなり、思考モードで複数ラウンドの「思考+呼び出しツール」をサポートできるだけでなく、非思考モードの呼び出しもサポートできます。 公式は1,800以上の環境と85,000の複雑な命令を統合して大規模なエージェント訓練データを構築し、モデルは様々なエージェントの評価において現行のオープンソースモデルのトップレベルに達しました。 V3.2-Specialeは一時的なエンドポイントbase_url設定でアクセス可能で、サービスは2025年12月15日北京時間23時59分に終了する予定です。
FAQ
Q: DeepSeek-V3.2とV3.2-Specialeの位置付けの違いは何ですか?
A: V3.2は日々のQ&Aや一般エージェントを対象としており、推論とコストバランスを重視しています。 V3.2-スペシャルは極限の推論能力を追求し、難しい数学とプログラミングの課題に重点を置いています。
Q: 現在、ウェブやアプリで呼びかけられているモデルは何ですか?
A: DeepSeekはウェブ、アプリ、標準APIのデフォルトモデルを公式バージョンのDeepSeek-V3.2にアップグレードし、V3.2-Expは使用していません。
Q: V3.2-Specialeにはどのようにアクセスできますか?また、制限は何ですか?
A: APIで特定のbase_urlを設定する必要があります。このバージョンは思考モードの会話のみをサポートし、ツール呼び出しはサポートしていません。最大出力長は128Kで、サービスは2025年12月15日まで有効です。
Q: 「思考モードでのツールコール」とは具体的にどういう意味ですか?
A: V3.2は推論プロセス中にツール呼び出しを複数回挿入し、ツールの返還結果と組み合わせてそれを考え続けることができ、複雑で多ステップのエージェントタスクシナリオに適しています。
Q: 両方のモデルはすでにオープンソースですか?
A: 公式のV3.2およびV3.2-Specialeは、HuggingFaceとModelScopeでコミュニティダウンロード用に公開されており、技術レポートや思考モードAPIドキュメントも含まれています。