2025年9月29日、DeepSeekは実験モデルDeepSeek-V3.2-Expをリリースし、 V3.1-TerminusをベースにDeepSeek Sparse Attention(DSA)を初めて搭載しました。DSAは、細粒度のスパースアテンションを用いることで、出力品質を最小限に抑えながら、ロングコンテキストの学習と推論の効率を大幅に向上させます。社内比較では、DSAの全体的なパフォーマンスはV3.1-Terminusと同等であることが示されています。このモデルは現在、アプリ、ウェブ、APIで同時に利用可能です。
付属ドキュメントによると、deepseek-chatとdeepseek-reasonerはV3.2-Expに切り替わっています。価格ページも更新され、 API価格が50%以上値下げされることが発表されています。現在の仕様は128KBコンテキストのままで、非思考モードと思考モードのデフォルトおよび最大出力制限は変更ありません。値下げは、キャッシュヒットとキャッシュミスの両方の入力価格と出力価格に適用されます。
よくある質問
Q: V3.2-Exp の主な変更点は何ですか?
A: 品質を犠牲にすることなくコストを削減することを目的として、長いコンテキストの計算効率に重点を置いた DSA スパース アテンションを導入しました。
Q: V3.1-Terminus との関係は何ですか?
A: これは改良を重ねている実験版です。ベンチマークパフォーマンスはほぼ同じで、効率性の向上に重点を置いています。
Q: 現在どこで入手できますか?
A: DeepSeek のアプリ、Web バージョン、API で利用できるようになりました。
Q: コンテキストと出力の制限は変わりますか?
A: コンテキストは依然として 128 KB です。非思考モード/思考モードのデフォルトおよび最大出力長は以前と同じです。
Q: 価格はどのくらい下がりますか?
A: 料金ページには新しい料金プラン(例:入力キャッシュヒット:0.028ドル/百万トークン、ミス:0.28ドル/百万トークン、出力:0.42ドル)が記載されており、これは以前のレベルと比較して全体で50%以上の値下げとなります。詳細は公式ページをご覧ください。