DeepSeek veröffentlicht V3.2 und V3.2-Speciale: Inference-first Models für Agentenszenarien

KI-Informationen • Admin • 1.12.2025 • 204 Aufrufe

Vor

zwei Monaten veröffentlichte DeepSeek sein experimentelles Modell V3.2-Exp und bestätigte durch Rückkehrbesuche der Nutzer, dass es V3.1-Terminus in verschiedenen Szenarien nicht unterlegen ist, wodurch die Wirksamkeit des Sparse-Attention-Mechanismus von DSA überprüft wurde. Die neuesten offiziellen Versionen von DeepSeek-V3.2 und DeepSeek-V3.2-Speciale sind jetzt verfügbar, wobei V3.2 V3.2-Exp auf der offiziellen Website, der App und der API als Standard-Servicemodell vollständig ersetzt hat, und die Speciale-Version als temporärer API-Dienst für Community-Bewertung und -Forschung offensteht.

Laut dem Beamten ist das Ziel von V3.2, ein Gleichgewicht zwischen Denkfähigkeit und Ausgabelänge zu finden, das für tägliche Szenarien wie Q&A und allgemeine Agenten geeignet ist, und das Niveau von GPT-5 im Public Reasoning Benchmark zu erreichen, das nur geringfügig niedriger ist als Gemini-3.0-Pro und in der Ausgabelänge und dem Rechenaufwand zurückhaltender ist als Kimi-K2-Thinking. V3.2-Speciale verbessert seine langfristige Denkfähigkeit erheblich und integriert die Theorembeweisfähigkeit von DeepSeek-Math-V2 und gewann Goldmedaillen bei den IMO, CMO, ICPC World Finals und IOI 2025, wobei ICPC- und IOI-Leistungen bei den menschlichen Spielern nahe dem zweiten bzw. zehnten Platz lagen. Dieses Modell spezialisiert sich auf komplexe Schlussfolgeraufgaben mit deutlich höherem Tokenverbrauch und unterstützt derzeit nur Denkmodus-Dialog, ist nicht für Werkzeugaufrufe offen und hat eine maximale Ausgabelänge von 128K.

Im Hinblick auf Agentenanwendungen ist DeepSeek-V3.2 das erste Modell geworden, das "Denken" direkt in Werkzeugaufrufe integriert, was nicht nur mehrere Runden von "Denken + Aufrufen" im Denkmodus unterstützen kann, sondern auch nicht-denkende Modusaufrufe. Der Offizielle erstellte groß angelegte Agententrainingsdaten, indem er mehr als 1.800 Umgebungen und 85.000 komplexe Anweisungen synthetisierte, sodass das Modell die führende Ebene des aktuellen Open-Source-Modells bei der Bewertung verschiedener Agenten erreichte. V3.2-Speciale ist über eine temporäre Endpunkt-base_url-Konfiguration zugänglich, und der Service soll am 15. Dezember 2025 um 23:59 Uhr Pekinger Zeit enden.

FAQ

F: Was ist der Unterschied zwischen der Positionierung von DeepSeek-V3.2 und V3.2-Speciale?

A: V3.2 richtet sich an tägliche Fragerunden und allgemeine Agenten und legt den Schwerpunkt auf Argumentation und Kostenausgleich. V3.2-Speciale verfolgt extreme Denkfähigkeiten und konzentriert sich auf schwierige Mathematik- und Programmieraufgaben.

F: Welches Modell wird derzeit im Web und in der App genannt?

A: DeepSeek hat das Standardmodell des Webs, der App und der Standard-APIs auf die offizielle Version von DeepSeek-V3.2 aktualisiert und verwendet V3.2-Exp nicht mehr.

F: Wie kann ich auf V3.2-Speciale zugreifen und welche Einschränkungen gibt es?

A: Sie müssen eine bestimmte base_url in der API festlegen, die aufgerufen werden soll; diese Version unterstützt nur Thinking Mode-Gespräche, keine Tool-Aufrufe, die maximale Ausgabelänge beträgt 128K, und der Dienst ist bis zum 15. Dezember 2025 geöffnet.

F: Was genau bedeutet "Tool Call in Thinking Mode"?

A: V3.2 kann während des Inferenzprozesses mehrfach Werkzeugaufrufe einfügen und anschließend weiterhin darüber nachdenken, in Kombination mit den Rückgabeergebnissen des Werkzeugs, das für komplexe und mehrstufige Agentenaufgaben geeignet ist.

F: Sind beide Modelle bereits Open Source?

A: Die offiziellen V3.2 und V3.2-Speciale wurden auf HuggingFace und ModelScope als Community-Download veröffentlicht, zusammen mit technischen Berichten und Dokumentation der Thinking Mode API.

DeepSeek veröffentlicht V3.2 und V3.2-Speciale: Inference-first Models für Agentenszenarien

Verwandte Artikel

Abbildung 03 Was ist ein humanoider Roboter? Verstehen Sie den Artikel Allgemeine Arbeit für Haushalte

DeepSeek-V3.2 veröffentlicht: Effizientes Schließen und allgemeine Agentenfähigkeiten mit wenig Aufmerksamkeit

Kimi K3 wurde offiziell gestartet: 2,8 Billionen Parameter mit Einsatz auf Millionen von Kontexten und offenem Gewicht

Mistral Studio fügt Prompt-Versionsmanagement hinzu: Enterprise AI verwaltet jetzt Verhaltensressourcen

Empfohlene Tools

DeepSeek veröffentlicht V3.2 und V3.2-Speciale: Inference-first Models für Agentenszenarien

Verwandte Artikel

Abbildung 03 Was ist ein humanoider Roboter? Verstehen Sie den Artikel Allgemeine Arbeit für Haushalte

DeepSeek-V3.2 veröffentlicht: Effizientes Schließen und allgemeine Agentenfähigkeiten mit wenig Aufmerksamkeit

Kimi K3 wurde offiziell gestartet: 2,8 Billionen Parameter mit Einsatz auf Millionen von Kontexten und offenem Gewicht

Mistral Studio fügt Prompt-Versionsmanagement hinzu: Enterprise AI verwaltet jetzt Verhaltensressourcen

Empfohlene Tools

KI-Tool einreichen

Bitte bestätigen Sie die Einreichungsinformationen