Retour à Informations sur l’IA
DeepSeek publie les versions 3.2 et 3.2-Speciale : modèles d’inférence d’abord pour les scénarios agents

DeepSeek publie les versions 3.2 et 3.2-Speciale : modèles d’inférence d’abord pour les scénarios agents

Informations sur l’IA Admin 165 vues

Il y a deux mois, DeepSeek a publié son modèle expérimental V3.2-Exp et a confirmé qu’il n’était pas inférieur à V3.1-Terminus dans divers scénarios grâce à des visites de retour utilisateurs, vérifiant ainsi l’efficacité du mécanisme d’attention clairsemée de DSA. Les dernières versions officielles de DeepSeek-V3.2 et DeepSeek-V3.2-Speciale sont désormais disponibles, dans lesquelles la version 3.2 a complètement remplacé la version V3.2-Exp sur le site officiel, l’application et l’API comme modèle de service par défaut, et la version Speciale est ouverte en tant que service API temporaire pour l’évaluation et la recherche communautaires.

Selon le responsable, l’objectif de la V3.2 est de trouver un équilibre entre la capacité de raisonnement et la longueur de la sortie, adapté aux scénarios quotidiens tels que les Q&A et les agents généraux, et d’atteindre le niveau de GPT-5 sur le benchmark de raisonnement public, qui est seulement légèrement inférieur à Gemini-3.0-Pro, et qui est plus limité en longueur de sortie et en charge computationnelle que Kimi-K2-Thinking. V3.2-Speciale améliore considérablement sa capacité de réflexion à long terme et intègre la capacité de démonstration de théorèmes de DeepSeek-Math-V2, et a remporté des médailles d’or lors de l’IMO, CMO, ICPC World Finals et IOI 2025, avec des performances de l’ICPC et de l’IOI proches respectivement de la deuxième et dixième place parmi les joueurs humains. Ce modèle est spécialisé dans les tâches de raisonnement complexes, avec une consommation de tokens nettement plus élevée, et ne supporte actuellement que le dialogue en mode pensée, non ouvert aux appels d’outils, et a une longueur de sortie maximale de 128K.

En ce qui concerne les applications agents, DeepSeek-V3.2 est devenu le premier modèle à intégrer directement la « pensée » dans les appels d’outils, ce qui peut non seulement supporter plusieurs cycles d’outils « penser + appeler » en mode pensée, mais aussi supporter les appels en mode non-pensant. Le responsable a construit des données d’entraînement d’agents à grande échelle en synthétisant plus de 1 800 environnements et 85 000 instructions complexes, de sorte que le modèle atteignait le niveau de référence du modèle open source actuel dans l’évaluation de divers agents. La version V3.2-Speciale est accessible via une configuration temporaire de base_url de terminaison, et le service devrait se terminer à 23h59, heure de Pékin, le 15 décembre 2025.

FAQ

Q : Quelle est la différence entre le positionnement de DeepSeek-V3.2 et V3.2-Speciale ?

R : La version 3.2 s’adresse aux Q&A quotidiens et aux agents généraux, en mettant l’accent sur le raisonnement et l’équilibre des coûts. La version 3.2-Speciale privilégie une capacité de raisonnement extrême, en se concentrant sur des tâches mathématiques et de programmation difficiles.

Q : Quel modèle est actuellement proposé sur le web et l’application ?

R : DeepSeek a mis à jour le modèle par défaut du web, de l’application et des API standard vers la version officielle de DeepSeek-V3.2, et n’utilise plus la version 3.2-Exp.

Q : Comment puis-je accéder à V3.2-Speciale et quelles sont ses limites ?

R : Vous devez définir un base_url spécifique dans l’API pour appeler, cette version ne prend en charge que les conversations en mode réflexion, ne prend pas en charge les appels d’outils, la longueur maximale de sortie est de 128K, et le service est ouvert jusqu’au 15 décembre 2025.

Q : Que signifie exactement « appel d’outils en mode réflexion » ?

R : La version 3.2 peut insérer plusieurs appels d’outils au cours du processus d’inférence, puis continuer à y réfléchir en combinaison avec les résultats de retour de l’outil, ce qui convient à des scénarios complexes et à plusieurs étapes de tâches d’agent.

Q : Les deux modèles sont-ils déjà open source ?

R : Les versions officielles V3.2 et V3.2-Speciale ont été publiées sur HuggingFace et ModelScope en téléchargement communautaire, ainsi que des rapports techniques et la documentation de l’API Thinking Mode.

Analyse officielle du modèle DeepSeek V3.2 DeepSeekV3.2 Spéciale Réflexion longue DeepSeekV3.2 teste la puissance de raisonnement GPT5 DeepSeek V3.2 comparé à Gemini 3.0 Pro La différence de puissance de calcul entre DeepSeekV3.2 et KimiK2 DeepSeek V3.2 convient aux scénarios généraux d’AIAgent V3.2 Artefact de raisonnement mathématique difficile La fusion de la V3.2 Speciale avec DeepSeekMathV2 Mécanisme d’attention parcimonieuse DeepSeekV3.2DSA Appel à l’outil de réflexion multi-rounds DeepSeek V3.2 L’application web DeepSeek V3.2 est entièrement lancée Modèle de service par défaut de l’API DeepSeekV3.2 V3.2 Description de la baseurl du point de terminaison temporaire Speciale Rappel de la date limite de service V3.2 Speciale Longueur de sortie et équilibre des coûts de DeepSeek V3.2 La longueur de sortie maximale de la V3.2Speciale est de 128K Scores DeepSeekV3.2 dans la liste publique d’inférence Médaille d’or à l’Olympiade de Mathématiques V3.2 SpecialeIMO Résultats de V3.2 Speciale dans la compétition CMO V3.2 SpécialeICPC niveau des Finales Mondiales V3.2 SpecialeIOI2025 est proche du top dix de l’humanité DeepSeek V3.2 convient aux tâches complexes en plusieurs étapes Expérience de conversation en mode pensée DeepSeek V3.2 Contrôle des coûts en mode non-pensant DeepSeekV3.2 Données de synthèse à grande échelle DeepSeekV3.2Agent Détails environnementaux des trains DeepSeek V3.2 1800 Jeu de données complexe d’instructions DeepSeekV32,8500 DeepSeekV3.2 dirige l’évaluation des agents open source La V3.2 Speciale est spécialisée dans la résolution de problèmes de programmation complexes DeepSeek V3.2 convient à une utilisation quotidienne en Q&A DeepSeek V3.2 remplace les notes de version de la V3.2Exp DeepSeek V3.2 vs. V3.1 Terminus Retour sur l’effet de retour des utilisateurs DeepSeekV3.2Exp DeepSeek V3.2 est adapté comme modèle principal de l’entreprise L’outil d’adaptation DeepSeek V3.2 appelle le cadre AIAgent Canal open source de téléchargement de poids DeepSeek V3.2 Acquisition de poids du modèle open-source V3.2 Speciale Dépôt de modèles DeepSeek V3.2HuggingFace Téléchargez et utilisez DeepSeekV3.2ModelScope Rapport technique et documentation API de DeepSeek V3.2 Comment choisir DeepSeek V3.2 ou Speciale Pour quels scénarios de développeur DeepSeek V3.2 convient-il ? Modèle spécial : Évaluation du coût de consommation des jetons DeepSeekV3.2 est utilisé dans les compétitions de programmation mathématique Utilisez la version 3.2 pour construire un flux de travail d’agent commun Appels d’outils DeepSeek V3.2 et limites de sécurité Avantages de la sortie par inférence de texte long DeepSeekV3.2 Le mode Pensée Spéciale ne supporte pas les limites d’outils DeepSeek V3.2 est une perspective de privatisation dans les entreprises DeepSeek V3.2 comparé à d’autres modèles nationaux de grande taille

Outils Recommandés

Plus