Vor
zwei Monaten veröffentlichte DeepSeek sein experimentelles Modell V3.2-Exp und bestätigte durch Rückkehrbesuche der Nutzer, dass es V3.1-Terminus in verschiedenen Szenarien nicht unterlegen ist, wodurch die Wirksamkeit des Sparse-Attention-Mechanismus von DSA überprüft wurde. Die neuesten offiziellen Versionen von DeepSeek-V3.2 und DeepSeek-V3.2-Speciale sind jetzt verfügbar, wobei V3.2 V3.2-Exp auf der offiziellen Website, der App und der API als Standard-Servicemodell vollständig ersetzt hat, und die Speciale-Version als temporärer API-Dienst für Community-Bewertung und -Forschung offensteht.
Laut dem Beamten ist das Ziel von V3.2, ein Gleichgewicht zwischen Denkfähigkeit und Ausgabelänge zu finden, das für tägliche Szenarien wie Q&A und allgemeine Agenten geeignet ist, und das Niveau von GPT-5 im Public Reasoning Benchmark zu erreichen, das nur geringfügig niedriger ist als Gemini-3.0-Pro und in der Ausgabelänge und dem Rechenaufwand zurückhaltender ist als Kimi-K2-Thinking. V3.2-Speciale verbessert seine langfristige Denkfähigkeit erheblich und integriert die Theorembeweisfähigkeit von DeepSeek-Math-V2 und gewann Goldmedaillen bei den IMO, CMO, ICPC World Finals und IOI 2025, wobei ICPC- und IOI-Leistungen bei den menschlichen Spielern nahe dem zweiten bzw. zehnten Platz lagen. Dieses Modell spezialisiert sich auf komplexe Schlussfolgeraufgaben mit deutlich höherem Tokenverbrauch und unterstützt derzeit nur Denkmodus-Dialog, ist nicht für Werkzeugaufrufe offen und hat eine maximale Ausgabelänge von 128K.
Im Hinblick auf Agentenanwendungen ist DeepSeek-V3.2 das erste Modell geworden, das "Denken" direkt in Werkzeugaufrufe integriert, was nicht nur mehrere Runden von "Denken + Aufrufen" im Denkmodus unterstützen kann, sondern auch nicht-denkende Modusaufrufe. Der Offizielle erstellte groß angelegte Agententrainingsdaten, indem er mehr als 1.800 Umgebungen und 85.000 komplexe Anweisungen synthetisierte, sodass das Modell die führende Ebene des aktuellen Open-Source-Modells bei der Bewertung verschiedener Agenten erreichte. V3.2-Speciale ist über eine temporäre Endpunkt-base_url-Konfiguration zugänglich, und der Service soll am 15. Dezember 2025 um 23:59 Uhr Pekinger Zeit enden.
FAQ
F: Was ist der Unterschied zwischen der Positionierung von DeepSeek-V3.2 und V3.2-Speciale?
A: V3.2 richtet sich an tägliche Fragerunden und allgemeine Agenten und legt den Schwerpunkt auf Argumentation und Kostenausgleich. V3.2-Speciale verfolgt extreme Denkfähigkeiten und konzentriert sich auf schwierige Mathematik- und Programmieraufgaben.
F: Welches Modell wird derzeit im Web und in der App genannt?
A: DeepSeek hat das Standardmodell des Webs, der App und der Standard-APIs auf die offizielle Version von DeepSeek-V3.2 aktualisiert und verwendet V3.2-Exp nicht mehr.
F: Wie kann ich auf V3.2-Speciale zugreifen und welche Einschränkungen gibt es?
A: Sie müssen eine bestimmte base_url in der API festlegen, die aufgerufen werden soll; diese Version unterstützt nur Thinking Mode-Gespräche, keine Tool-Aufrufe, die maximale Ausgabelänge beträgt 128K, und der Dienst ist bis zum 15. Dezember 2025 geöffnet.
F: Was genau bedeutet "Tool Call in Thinking Mode"?
A: V3.2 kann während des Inferenzprozesses mehrfach Werkzeugaufrufe einfügen und anschließend weiterhin darüber nachdenken, in Kombination mit den Rückgabeergebnissen des Werkzeugs, das für komplexe und mehrstufige Agentenaufgaben geeignet ist.
F: Sind beide Modelle bereits Open Source?
A: Die offiziellen V3.2 und V3.2-Speciale wurden auf HuggingFace und ModelScope als Community-Download veröffentlicht, zusammen mit technischen Berichten und Dokumentation der Thinking Mode API.