一、开源与获取
MiMo 已开放权重与配套资料。优先在 Hugging Face 的 XiaomiMiMo 组织页获取模型(含 MiMo-V2-Flash/Base 等),技术报告与部分代码在 GitHub;也提供在线 Studio 与 API 平台入口。
二、技术架构与数据
MiMo-V2-Flash 采用 MoE:309B 总参、约 15B 激活参,主打高效推理与 Agent 工作流。架构上使用混合滑窗/全局注意力以降低 KV 缓存,并引入轻量多词元预测(MTP)。官方披露预训练规模为 27T tokens,但未公开更细的数据来源清单;后训练强调多教师蒸馏与 Agentic RL,会产生大量任务轨迹数据。
三、速度效率与部署
混合注意力可显著压缩 KV 占用,MTP 用于提升输出速度,整体更偏“低成本高吞吐”。部署可走 SGLang 等方案,本地运行可配合并行与量化降低门槛。
四、对比与生态落地
与 GPT 等闭源模型相比,MiMo 的优势在开放权重、可私有化部署与成本可控;在官方对比基准里推理/代码表现突出,但写作类与通用能力是否追平仍需同条件实测。落地上更契合小米“人车家”系统入口:家庭设备联动、车内语音与导航问答、跨设备任务编排、开发者 Agent 工具链等。
五、Q&A 常见延伸问题
Q:MiMo 可以商用吗?
A:以模型页与仓库标注的 License 为准;例如部分权重标注为 MIT,通常允许商用,但仍需遵守条款与合规要求。
Q:智能家居和汽车会怎么用到 MiMo?
A:更像 HyperOS/系统级 AI 底座,通过统一协议与 Agent 编排把“问答+控制+自动化”贯通到家电与车机场景。
Q:我该怎么验证它是否比 GPT 更适合?
A:用你的真实任务集做离线 A/B,对比工具成功率、幻觉率、延迟与单位成本,比单一跑分更可靠。