DeepSeek veröffentlicht V3.2-Exp: Einführung von DSA basierend auf V3.1-Terminus, wodurch langer Kontext effizienter wird

KI-Informationen • Admin • 29.9.2025 • 87 Aufrufe

Am 29. September 2025 veröffentlichte DeepSeek das experimentelle Modell DeepSeek-V3.2-Exp und führte damit DeepSeek Sparse Attention (DSA) auf Basis von V3.1-Terminus ein. Offiziell nutzt DSA feinkörnige Sparse Attention, um die Effizienz von Langkontexttraining und Inferenz deutlich zu verbessern und gleichzeitig die Ausgabequalität zu minimieren. Interne Vergleiche zeigen, dass die Gesamtleistung mit V3.1-Terminus vergleichbar ist. Das Modell ist jetzt gleichzeitig in der App, im Web und über die API verfügbar.

Die beiliegende Dokumentation zeigt, dass Deepseek-Chat und Deepseek-Reasoner auf Version 3.2-Exp umgestellt wurden. Die Preisseite wurde ebenfalls aktualisiert und kündigt eine Reduzierung der API-Preise um über 50 % an. Die aktuelle Spezifikation bleibt bei 128 KB Kontext , und die Standard- und maximalen Ausgabegrenzen für den Nicht-Denk- und Denkmodus bleiben unverändert. Die Preissenkung gilt sowohl für die Eingabepreise für Cache-Treffer und Cache-Miss als auch für die Ausgabepreise.

Häufig gestellte Fragen

F: Was sind die wichtigsten Änderungen in V3.2-Exp?

A: Wir haben DSA Sparse Attention eingeführt, wobei der Schwerpunkt auf der Rechenleistung langer Kontexte liegt, mit dem Ziel, die Kosten zu senken, ohne die Qualität zu beeinträchtigen.

F: Welche Beziehung besteht zu V3.1-Terminus?

A: Dies ist eine experimentelle Version, die iterativ weiterentwickelt wird. Die Benchmark-Leistung ist in etwa gleich, der Schwerpunkt liegt auf Effizienzverbesserungen.

F: Wo ist es jetzt verfügbar?

A: Es ist jetzt in der App, der Webversion und der API von DeepSeek verfügbar.

F: Werden sich Kontext und Ausgabegrenzen ändern?

A: Der Kontext ist immer noch 128 KB groß; die Standard- und Maximalausgabelängen für den Nicht-Denkmodus/Denkmodus sind dieselben wie zuvor.

F: Um wie viel wird der Preis sinken?

A: Auf der Preisseite sind neue Stufen aufgeführt (z. B. Input-Cache-Hit 0,028 $/Million Token, Miss 0,28 $, Output 0,42 $). Dies entspricht einer Gesamtreduzierung von über 50 % gegenüber dem vorherigen Level. Weitere Informationen finden Sie auf der offiziellen Seite.

DeepSeek veröffentlicht V3.2-Exp: Einführung von DSA basierend auf V3.1-Terminus, wodurch langer Kontext effizienter wird

Verwandte Artikel

KI-News rund um die Uhr: Einführung der OpenAI-Kindersicherung, Preissenkungen und Iterationen bei DeepSeek

ChatGPT führt Funktionen zur Kindersicherung ein: darunter das erste Sicherheitsbenachrichtigungssystem zum Thema „Selbstverletzungsrisiko bei Jugendlichen“

Kimi K3 wurde offiziell gestartet: 2,8 Billionen Parameter mit Einsatz auf Millionen von Kontexten und offenem Gewicht

Mistral Studio fügt Prompt-Versionsmanagement hinzu: Enterprise AI verwaltet jetzt Verhaltensressourcen

Empfohlene Tools

DeepSeek veröffentlicht V3.2-Exp: Einführung von DSA basierend auf V3.1-Terminus, wodurch langer Kontext effizienter wird

Verwandte Artikel

KI-News rund um die Uhr: Einführung der OpenAI-Kindersicherung, Preissenkungen und Iterationen bei DeepSeek

ChatGPT führt Funktionen zur Kindersicherung ein: darunter das erste Sicherheitsbenachrichtigungssystem zum Thema „Selbstverletzungsrisiko bei Jugendlichen“

Kimi K3 wurde offiziell gestartet: 2,8 Billionen Parameter mit Einsatz auf Millionen von Kontexten und offenem Gewicht

Mistral Studio fügt Prompt-Versionsmanagement hinzu: Enterprise AI verwaltet jetzt Verhaltensressourcen

Empfohlene Tools

KI-Tool einreichen

Bitte bestätigen Sie die Einreichungsinformationen