Il y a deux mois, DeepSeek a publié son modèle expérimental V3.2-Exp et a confirmé qu’il n’était pas inférieur à V3.1-Terminus dans divers scénarios grâce à des visites de retour utilisateurs, vérifiant ainsi l’efficacité du mécanisme d’attention clairsemée de DSA. Les dernières versions officielles de DeepSeek-V3.2 et DeepSeek-V3.2-Speciale sont désormais disponibles, dans lesquelles la version 3.2 a complètement remplacé la version V3.2-Exp sur le site officiel, l’application et l’API comme modèle de service par défaut, et la version Speciale est ouverte en tant que service API temporaire pour l’évaluation et la recherche communautaires.
Selon le responsable, l’objectif de la V3.2 est de trouver un équilibre entre la capacité de raisonnement et la longueur de la sortie, adapté aux scénarios quotidiens tels que les Q&A et les agents généraux, et d’atteindre le niveau de GPT-5 sur le benchmark de raisonnement public, qui est seulement légèrement inférieur à Gemini-3.0-Pro, et qui est plus limité en longueur de sortie et en charge computationnelle que Kimi-K2-Thinking. V3.2-Speciale améliore considérablement sa capacité de réflexion à long terme et intègre la capacité de démonstration de théorèmes de DeepSeek-Math-V2, et a remporté des médailles d’or lors de l’IMO, CMO, ICPC World Finals et IOI 2025, avec des performances de l’ICPC et de l’IOI proches respectivement de la deuxième et dixième place parmi les joueurs humains. Ce modèle est spécialisé dans les tâches de raisonnement complexes, avec une consommation de tokens nettement plus élevée, et ne supporte actuellement que le dialogue en mode pensée, non ouvert aux appels d’outils, et a une longueur de sortie maximale de 128K.
En ce qui concerne les applications agents, DeepSeek-V3.2 est devenu le premier modèle à intégrer directement la « pensée » dans les appels d’outils, ce qui peut non seulement supporter plusieurs cycles d’outils « penser + appeler » en mode pensée, mais aussi supporter les appels en mode non-pensant. Le responsable a construit des données d’entraînement d’agents à grande échelle en synthétisant plus de 1 800 environnements et 85 000 instructions complexes, de sorte que le modèle atteignait le niveau de référence du modèle open source actuel dans l’évaluation de divers agents. La version V3.2-Speciale est accessible via une configuration temporaire de base_url de terminaison, et le service devrait se terminer à 23h59, heure de Pékin, le 15 décembre 2025.
FAQ
Q : Quelle est la différence entre le positionnement de DeepSeek-V3.2 et V3.2-Speciale ?
R : La version 3.2 s’adresse aux Q&A quotidiens et aux agents généraux, en mettant l’accent sur le raisonnement et l’équilibre des coûts. La version 3.2-Speciale privilégie une capacité de raisonnement extrême, en se concentrant sur des tâches mathématiques et de programmation difficiles.
Q : Quel modèle est actuellement proposé sur le web et l’application ?
R : DeepSeek a mis à jour le modèle par défaut du web, de l’application et des API standard vers la version officielle de DeepSeek-V3.2, et n’utilise plus la version 3.2-Exp.
Q : Comment puis-je accéder à V3.2-Speciale et quelles sont ses limites ?
R : Vous devez définir un base_url spécifique dans l’API pour appeler, cette version ne prend en charge que les conversations en mode réflexion, ne prend pas en charge les appels d’outils, la longueur maximale de sortie est de 128K, et le service est ouvert jusqu’au 15 décembre 2025.
Q : Que signifie exactement « appel d’outils en mode réflexion » ?
R : La version 3.2 peut insérer plusieurs appels d’outils au cours du processus d’inférence, puis continuer à y réfléchir en combinaison avec les résultats de retour de l’outil, ce qui convient à des scénarios complexes et à plusieurs étapes de tâches d’agent.
Q : Les deux modèles sont-ils déjà open source ?
R : Les versions officielles V3.2 et V3.2-Speciale ont été publiées sur HuggingFace et ModelScope en téléchargement communautaire, ainsi que des rapports techniques et la documentation de l’API Thinking Mode.