MiMo-V2-Flash总309B激活15B说明

找到 1 篇相关文章

MiMo-V2-Flash发布：256K长上下文与多Token预测提升推理吞吐

小米MiMo与小米大模型Core团队发布并开放MiMo-V2-Flash相关资源，定位为面向高速度推理与智能体工作流的基础语言模型，模型权重与推理部署资料同步提供给开发者与研究者使用。该模型为Mixture-of-Experts（MoE）架构，总参数约309B、推理时激活约15B，并支持最高约25...

AI资讯 • Admin • 2025/12/17

150

MiMo-V2-Flash总309B激活15B说明

MiMo-V2-Flash发布：256K长上下文与多Token预测提升推理吞吐

推荐工具

提交AI工具

请确认提交信息