Mistral AI 宣布推出新一代模型家族 Mistral 3,包括稀疏专家混合架构的 Mistral Large 3,以及面向本地与边缘场景的 Ministral 3 系列(3B、8B、14B)。官方介绍称,Large 3 采用约41B激活参数、675B总参数的 MoE 结构,在通用指令任务、多语言对话及图像理解上达到当前开放权重模型的领先水平,基础版与指令微调版均以 Apache 2.0 协议开源,便于企业和开发者进行二次定制。
Ministral 3 系列同样提供 base、instruct 与 reasoning 三类变体,支持多模态与多语言,主打在相同任务下输出更少 Token、实现更优性能成本比;其中 14B reasoning 版本在 AIME 2025 等推理基准上取得同量级模型中的领先成绩。Mistral 同时与 NVIDIA、vLLM、Red Hat 等生态合作,为 Mistral 3 家族提供 TensorRT-LLM、SGLang 等推理优化,以及在 Blackwell、Hopper GPU 与 RTX PC、Jetson 设备上的高效部署路径,使模型可从数据中心延伸到机器人与边缘终端。
目前,Mistral 3 已可在 Mistral AI Studio、Amazon Bedrock、Azure Foundry、Hugging Face、Modal、IBM watsonx、OpenRouter、Fireworks、Unsloth AI、Together AI 等平台使用,并计划登陆 NVIDIA NIM 与 AWS SageMaker。Mistral 还提供定制训练服务,为有特定领域需求的组织构建专用模型与企业级部署方案。
常见问题
Q:什么是 Mistral 3 模型家族?
A:Mistral 3 是 Mistral AI 发布的新一代模型系列,包括大规模的 Mistral Large 3 和面向本地、边缘场景的 Ministral 3(3B、8B、14B)多种尺寸与版本。
Q:Mistral Large 3 有哪些技术特点?
A:Large 3 采用稀疏 MoE 架构,活跃参数约41B、总参数约675B,支持图像理解与多语言对话,在开源指令模型中处于领先水平。
Q:Ministral 3 系列主要面向哪些应用?
A:Ministral 3 主打本地和边缘部署,提供 base、instruct、reasoning 变体,在保证效果的前提下减少 Token 生成量,适合在资源受限环境中进行推理与多模态应用。
Q:这些模型的授权方式怎样?
A:Mistral Large 3 和 Ministral 3 的基础版与指令版均以 Apache 2.0 许可证开源,便于企业在合规前提下进行微调、部署和商用。
Q:Mistral 3 目前可以在哪里使用与部署?
A:除在自家 Mistral AI Studio 提供 API 外,Mistral 3 已集成到 Amazon Bedrock、Azure Foundry、Hugging Face 等多家云与开发平台,并计划进一步扩展到 NVIDIA NIM 与 AWS SageMaker。