Zurück zu KI-Informationen
DeepSeek veröffentlicht V3.2 und V3.2-Speciale: Inference-first Models für Agentenszenarien

DeepSeek veröffentlicht V3.2 und V3.2-Speciale: Inference-first Models für Agentenszenarien

KI-Informationen Admin 165 Aufrufe

Vor

zwei Monaten veröffentlichte DeepSeek sein experimentelles Modell V3.2-Exp und bestätigte durch Rückkehrbesuche der Nutzer, dass es V3.1-Terminus in verschiedenen Szenarien nicht unterlegen ist, wodurch die Wirksamkeit des Sparse-Attention-Mechanismus von DSA überprüft wurde. Die neuesten offiziellen Versionen von DeepSeek-V3.2 und DeepSeek-V3.2-Speciale sind jetzt verfügbar, wobei V3.2 V3.2-Exp auf der offiziellen Website, der App und der API als Standard-Servicemodell vollständig ersetzt hat, und die Speciale-Version als temporärer API-Dienst für Community-Bewertung und -Forschung offensteht.

Laut dem Beamten ist das Ziel von V3.2, ein Gleichgewicht zwischen Denkfähigkeit und Ausgabelänge zu finden, das für tägliche Szenarien wie Q&A und allgemeine Agenten geeignet ist, und das Niveau von GPT-5 im Public Reasoning Benchmark zu erreichen, das nur geringfügig niedriger ist als Gemini-3.0-Pro und in der Ausgabelänge und dem Rechenaufwand zurückhaltender ist als Kimi-K2-Thinking. V3.2-Speciale verbessert seine langfristige Denkfähigkeit erheblich und integriert die Theorembeweisfähigkeit von DeepSeek-Math-V2 und gewann Goldmedaillen bei den IMO, CMO, ICPC World Finals und IOI 2025, wobei ICPC- und IOI-Leistungen bei den menschlichen Spielern nahe dem zweiten bzw. zehnten Platz lagen. Dieses Modell spezialisiert sich auf komplexe Schlussfolgeraufgaben mit deutlich höherem Tokenverbrauch und unterstützt derzeit nur Denkmodus-Dialog, ist nicht für Werkzeugaufrufe offen und hat eine maximale Ausgabelänge von 128K.

Im Hinblick auf Agentenanwendungen ist DeepSeek-V3.2 das erste Modell geworden, das "Denken" direkt in Werkzeugaufrufe integriert, was nicht nur mehrere Runden von "Denken + Aufrufen" im Denkmodus unterstützen kann, sondern auch nicht-denkende Modusaufrufe. Der Offizielle erstellte groß angelegte Agententrainingsdaten, indem er mehr als 1.800 Umgebungen und 85.000 komplexe Anweisungen synthetisierte, sodass das Modell die führende Ebene des aktuellen Open-Source-Modells bei der Bewertung verschiedener Agenten erreichte. V3.2-Speciale ist über eine temporäre Endpunkt-base_url-Konfiguration zugänglich, und der Service soll am 15. Dezember 2025 um 23:59 Uhr Pekinger Zeit enden.

FAQ

F: Was ist der Unterschied zwischen der Positionierung von DeepSeek-V3.2 und V3.2-Speciale?

A: V3.2 richtet sich an tägliche Fragerunden und allgemeine Agenten und legt den Schwerpunkt auf Argumentation und Kostenausgleich. V3.2-Speciale verfolgt extreme Denkfähigkeiten und konzentriert sich auf schwierige Mathematik- und Programmieraufgaben.

F: Welches Modell wird derzeit im Web und in der App genannt?

A: DeepSeek hat das Standardmodell des Webs, der App und der Standard-APIs auf die offizielle Version von DeepSeek-V3.2 aktualisiert und verwendet V3.2-Exp nicht mehr.

F: Wie kann ich auf V3.2-Speciale zugreifen und welche Einschränkungen gibt es?

A: Sie müssen eine bestimmte base_url in der API festlegen, die aufgerufen werden soll; diese Version unterstützt nur Thinking Mode-Gespräche, keine Tool-Aufrufe, die maximale Ausgabelänge beträgt 128K, und der Dienst ist bis zum 15. Dezember 2025 geöffnet.

F: Was genau bedeutet "Tool Call in Thinking Mode"?

A: V3.2 kann während des Inferenzprozesses mehrfach Werkzeugaufrufe einfügen und anschließend weiterhin darüber nachdenken, in Kombination mit den Rückgabeergebnissen des Werkzeugs, das für komplexe und mehrstufige Agentenaufgaben geeignet ist.

F: Sind beide Modelle bereits Open Source?

A: Die offiziellen V3.2 und V3.2-Speciale wurden auf HuggingFace und ModelScope als Community-Download veröffentlicht, zusammen mit technischen Berichten und Dokumentation der Thinking Mode API.

Offizielle Modellanalyse der DeepSeek V3.2 Version DeepSeekV3.2 Speciale: Langes Denken DeepSeekV3.2 benchmarkt die Logikleistung GPT5 DeepSeek V3.2 im Vergleich zu Gemini 3.0 Pro Der Unterschied in der Rechenleistung zwischen DeepSeekV3.2 und KimiK2 DeepSeek V3.2 eignet sich für allgemeine AIAgent-Szenarien V3.2 Spezielles schwieriges Artefakt des mathematischen Denkens V3.2 Speciale fusioniert mit DeepSeekMathV2 DeepSeekV3.2DSA-Sparse-Attention-Mechanismus DeepSeek V3.2 Multi-Round-Thinking-Tool Call Die Webanwendung DeepSeek V3.2 ist vollständig gestartet DeepSeekV3.2 API Standard-Servicemodell V3.2 Beschreibung der Speciale-Basisurl des temporären Endpunkts V3.2 Frist-Erinnerung für den Speciale-Service DeepSeek V3.2 Ausgangslänge und Kostenbilanz Die maximale Ausgangslänge des V3.2Speciale beträgt 128.000 DeepSeekV3.2-Werte in der öffentlichen Inferenzliste V3.2 SpecialeIMO Mathematikolympiade Goldmedaillenleistung V3.2 Speciales Ergebnisse im CMO-Wettbewerb V3.2 SpecialeICPC World Finals Level V3.2 SpecialeIOI2025 gehört zu den Top Ten der Menschheit DeepSeek V3.2 eignet sich für komplexe, mehrstufige Aufgaben DeepSeek V3.2 Denkmodus Gesprächserfahrung DeepSeekV3.2 Kostenkontrolle des nicht-denkenden Modus DeepSeekV3.2Agent großräumige Synthesedaten DeepSeek V3.2 trainiert 1800 Umweltdetails DeepSeekV32,8500 komplexer Befehlsdatensatz DeepSeekV3.2 leitet die Bewertung von Open-Source-Agenten V3.2 Speciale spezialisiert sich auf die Lösung schwieriger Programmierprobleme DeepSeek V3.2 eignet sich für die tägliche Nutzung von Fragen und Antworten DeepSeek V3.2 ersetzt die Release-Notes von V3.2Exp DeepSeek V3.2 vs. V3.1 Terminus DeepSeekV3.2Exp Rückmeldung zum Rückbesuchseffekt des Nutzers DeepSeek V3.2 eignet sich als Hauptmodell des Unternehmens Das DeepSeek V3.2-Anpassungstool nennt das AIAgent-Framework Open-Source-Downloadkanal DeepSeek V3.2 Weight V3.2 Spezielle Open-Source-Modellgewichtsaufnahme DeepSeek V3.2HuggingFace Modell-Repository DeepSeekV3.2ModelScope herunterladen und nutzen Sie es. DeepSeek v3.2 Technischer Bericht und API-Dokumentation Wie man DeepSeek V3.2 oder Speciale wählt Für welche Entwicklerszenarien eignet sich DeepSeek V3.2? Spezialmodell Token-Verbrauchskostenbewertung DeepSeekV3.2 wird in mathematischen Programmierwettbewerben eingesetzt Verwenden Sie V3.2, um einen Common Agent-Workflow zu erstellen DeepSeek V3.2-Toolaufrufe und Sicherheitsgrenzen Vorteile der DeepSeekV3.2 langen Textinferenzausgabe Der spezielle Denkmodus unterstützt keine Werkzeuggrenzen DeepSeek V3.2 ist eine Aussicht auf Privatisierung in Unternehmen DeepSeek V3.2 im Vergleich zu anderen großen Inlandsmodellen

Empfohlene Tools

Mehr