Zurück zu KI-Informationen
DeepSeek veröffentlicht V3.2-Exp: Einführung von DSA basierend auf V3.1-Terminus, wodurch langer Kontext effizienter wird

DeepSeek veröffentlicht V3.2-Exp: Einführung von DSA basierend auf V3.1-Terminus, wodurch langer Kontext effizienter wird

KI-Informationen Admin 80 Aufrufe

Am 29. September 2025 veröffentlichte DeepSeek das experimentelle Modell DeepSeek-V3.2-Exp und führte damit DeepSeek Sparse Attention (DSA) auf Basis von V3.1-Terminus ein. Offiziell nutzt DSA feinkörnige Sparse Attention, um die Effizienz von Langkontexttraining und Inferenz deutlich zu verbessern und gleichzeitig die Ausgabequalität zu minimieren. Interne Vergleiche zeigen, dass die Gesamtleistung mit V3.1-Terminus vergleichbar ist. Das Modell ist jetzt gleichzeitig in der App, im Web und über die API verfügbar.

Die beiliegende Dokumentation zeigt, dass Deepseek-Chat und Deepseek-Reasoner auf Version 3.2-Exp umgestellt wurden. Die Preisseite wurde ebenfalls aktualisiert und kündigt eine Reduzierung der API-Preise um über 50 % an. Die aktuelle Spezifikation bleibt bei 128 KB Kontext , und die Standard- und maximalen Ausgabegrenzen für den Nicht-Denk- und Denkmodus bleiben unverändert. Die Preissenkung gilt sowohl für die Eingabepreise für Cache-Treffer und Cache-Miss als auch für die Ausgabepreise.

Häufig gestellte Fragen

F: Was sind die wichtigsten Änderungen in V3.2-Exp?

A: Wir haben DSA Sparse Attention eingeführt, wobei der Schwerpunkt auf der Rechenleistung langer Kontexte liegt, mit dem Ziel, die Kosten zu senken, ohne die Qualität zu beeinträchtigen.

F: Welche Beziehung besteht zu V3.1-Terminus?

A: Dies ist eine experimentelle Version, die iterativ weiterentwickelt wird. Die Benchmark-Leistung ist in etwa gleich, der Schwerpunkt liegt auf Effizienzverbesserungen.

F: Wo ist es jetzt verfügbar?

A: Es ist jetzt in der App, der Webversion und der API von DeepSeek verfügbar.

F: Werden sich Kontext und Ausgabegrenzen ändern?

A: Der Kontext ist immer noch 128 KB groß; die Standard- und Maximalausgabelängen für den Nicht-Denkmodus/Denkmodus sind dieselben wie zuvor.

F: Um wie viel wird der Preis sinken?

A: Auf der Preisseite sind neue Stufen aufgeführt (z. B. Input-Cache-Hit 0,028 $/Million Token, Miss 0,28 $, Output 0,42 $). Dies entspricht einer Gesamtreduzierung von über 50 % gegenüber dem vorherigen Level. Weitere Informationen finden Sie auf der offiziellen Seite.

Empfohlene Tools

Mehr