Mistral AI hat die Einführung von Mistral 3 angekündigt, einer Modellfamilie der nächsten Generation, zu der Mistral Large 3 für eine sparsame, erfahrene Hybridarchitektur und die Ministral 3-Serie (3B, 8B, 14B) für lokale und Randszenarien gehören. Laut offizieller Einführung verwendet Large 3 eine MoE-Struktur mit etwa 41 Milliarden Aktivierungsparametern und insgesamt 675 Milliarden Parametern und erreicht damit das führende Niveau des aktuellen offenen Gewichtsmodells in allgemeinen Instruktionsaufgaben, mehrsprachigen Dialogen und Bildverständnis.
Die Ministral 3-Serie bietet außerdem Basis-, Unterweisungs- und Schlussfolgerungsvarianten, die multimodale und mehrsprachige Varianten unterstützen, mit Fokus darauf, weniger Token für dieselbe Aufgabe auszugeben und ein besseres Leistungs-Kosten-Verhältnis zu erreichen. Darunter erzielte die 14B-Logikversion führende Ergebnisse unter ähnlichen Modellen auf Benchmarks wie AIME 2025. Mistral arbeitet außerdem mit Ökosystemen wie NVIDIA, vLLM und Red Hat zusammen, um Inferenzoptimierungen wie TensorRT-LLM und SGLang für die Mistral-3-Familie bereitzustellen, sowie effiziente Bereitstellungswege auf Blackwell, Hopper-GPUs, RTX-PCs und Jetson-Geräten, sodass das Modell vom Rechenzentrum auf Roboter und Edge-Terminals erweitert werden kann.
Mistral 3 ist derzeit auf Plattformen wie Mistral AI Studio, Amazon Bedrock, Azure Foundry, Hugging Face, Modal, IBM watsonx, OpenRouter, Fireworks, Unsloth AI, Together AI und weiteren verfügbar, mit Plänen, auf NVIDIA NIM und AWS zu starten, mit Plänen, auf NVIDIA NIM und AWS zu starten SageMaker。 Mistral bietet außerdem maßgeschneiderte Schulungsdienste an, um speziell entwickelte Modelle und Unternehmens-Deployments für Organisationen mit domänenspezifischen Anforderungen zu erstellen.
FAQs
F: Was ist die Mistral 3 Modellfamilie?
A: Mistral 3 ist eine neue Modellserie, die von Mistral AI veröffentlicht wurde und die großformatigen Mistral Large 3 und Ministral 3 (3B, 8B, 14B) für lokale und Randszenarien umfasst.
F: Was sind die technischen Merkmale des Mistral Large 3?
A: Large 3 verwendet eine spärliche MoE-Architektur mit etwa 41 Milliarden aktiven Parametern und insgesamt 675 Milliarden Parametern, unterstützt Bildverständnis und mehrsprachigen Dialog und steht an der führenden Ebene unter den Open-Source-Instruktionsmodellen.
F: Was sind die Hauptanwendungen der Ministral 3-Serie?
A: Ministral 3 konzentriert sich auf lokale und Edge-Deployments und bietet Basis-, Instructing- und Reasoning-Varianten, um die Token-Generierung zu reduzieren und gleichzeitig die Effektivität zu gewährleisten, was es für Inferenz- und multimodale Anwendungen in ressourcenbegrenzten Umgebungen geeignet macht.
F: Wie werden diese Modelle lizenziert?
A: Die Basis- und Direktivenversionen von Mistral Large 3 und Ministral 3 sind Open Source unter der Apache 2.0-Lizenz, was es Unternehmen erleichtert, unter dem Vorwand der Compliance zu optimieren, einzusetzen und zu kommerzialisieren.
F: Wo kann Mistral 3 heute eingesetzt und eingesetzt werden?
A: Neben der Bereitstellung von APIs im eigenen Mistral AI Studio wurde Mistral 3 in mehrere Clouds und Entwicklungsplattformen wie Amazon Bedrock, Azure Foundry und Hugging Face integriert und plant eine weitere Expansion auf NVIDIA NIM und AWS SageMaker.