Mistral AI a annoncé le lancement de Mistral 3, une famille de modèles de nouvelle génération, incluant Mistral Large 3 pour une architecture hybride experte et minimaliste, ainsi que la série Ministral 3 (3B, 8B, 14B) pour les scénarios locaux et en périphérie. Selon l’introduction officielle, Large 3 adopte une structure MoE d’environ 41 milliards de paramètres d’activation et 675 milliards de paramètres totaux, atteignant le niveau de référence du modèle actuel en poids ouvert en matière de tâches d’instruction générales, de dialogue multilingue et de compréhension d’images.
La série Ministral 3 propose également des variantes de base, d’instruction et de raisonnement, prenant en charge le multimodal et le multilingue, en se concentrant sur la production de moins de tokens pour la même tâche et l’obtention d’un meilleur rapport performance-coût. Parmi eux, la version de raisonnement 14B a obtenu des résultats de premier plan parmi les modèles de magnitude similaire sur des benchmarks de raisonnement tels que l’AIME 2025. Mistral collabore également avec des écosystèmes tels que NVIDIA, vLLM et Red Hat pour fournir des optimisations d’inférence telles que TensorRT-LLM et SGLang pour la famille Mistral 3, ainsi que des chemins de déploiement efficaces sur Blackwell, les GPU Hopper, les PC RTX et les appareils Jetson, afin que le modèle puisse être étendu du centre de données aux robots et terminaux en périphérie.
Mistral 3 est actuellement disponible sur des plateformes telles que Mistral AI Studio, Amazon Bedrock, Azure Foundry, Hugging Face, Modal, IBM Watsonx, OpenRouter, Fireworks, Unsloth AI, Together AI, et bien d’autres, avec des projets de lancement sur NVIDIA NIM et AWS SageMaker。 Mistral propose également des services de formation personnalisés pour construire des modèles spécialement conçus et des déploiements au niveau entreprise pour des organisations ayant des besoins spécifiques à un domaine.
FAQ
Q : Qu’est-ce que la famille de modèles Mistral 3 ?
R : Mistral 3 est une nouvelle série de modèles de nouvelle génération publiée par Mistral AI, incluant les grandes versions Mistral Large 3 et Ministral 3 (3B, 8B, 14B) pour les scénarios locaux et périphériques.
Q : Quelles sont les caractéristiques techniques du Mistral Large 3 ?
R : Large 3 adopte une architecture MoE clairsemée avec environ 41 milliards de paramètres actifs et 675 milliards de paramètres au total, supportant la compréhension des images et le dialogue multilingue, et se situe au premier plan parmi les modèles d’instructions open source.
Q : Quelles sont les principales applications de la série Ministral 3 ?
R : Ministral 3 se concentre sur les déploiements locaux et en périphérie, fournissant des variantes de base, d’instruction et de raisonnement pour réduire la génération de jetons tout en assurant l’efficacité, ce qui le rend adapté aux applications d’inférence et multimodales dans des environnements à ressources limitées.
Q : Comment ces modèles sont-ils licenciés ?
R : Les versions de base et directive de Mistral Large 3 et Ministral 3 sont open source sous licence Apache 2.0, ce qui facilite l’ajustement, le déploiement et la commercialisation par les entreprises sous prétexte de conformité.
Q : Où Mistral 3 peut-il être utilisé et déployé aujourd’hui ?
R : En plus de fournir des API dans son propre Mistral AI Studio, Mistral 3 a été intégré à plusieurs clouds et plateformes de développement telles qu’Amazon Bedrock, Azure Foundry et Hugging Face, et prévoit de s’étendre davantage à NVIDIA NIM et AWS SageMaker.