MiMo-V2-Flash发布:256K长上下文与多Token预测提升推理吞吐 小米MiMo与小米大模型Core团队发布并开放MiMo-V2-Flash相关资源,定位为面向高速度推理与智能体工作流的基础语言模型,模型权重与推理部署资料同步提供给开发者与研究者使用。 该模型为Mixture-of-Experts(MoE)架构,总参数约309B、推理时激活约15B,并支持最高约25... AI资讯 • Admin • 2025/12/17 128