Xiaomi MiMo-V2.5 开源解读:MIT 协议、1M 上下文与原生多模态能力
一、摘要 Xiaomi MiMo-V2.5 系列已正式开源,采用 MIT License,权重与模型卡发布在 Hugging Face。该系列包含 MiMo-V2.5 与 MiMo-V2.5-Pro,均面向 1M-token 长上下文场景。MiMo-V2.5 偏原生多模态,覆盖文本、图像、视频与音频...
一、摘要 Xiaomi MiMo-V2.5 系列已正式开源,采用 MIT License,权重与模型卡发布在 Hugging Face。该系列包含 MiMo-V2.5 与 MiMo-V2.5-Pro,均面向 1M-token 长上下文场景。MiMo-V2.5 偏原生多模态,覆盖文本、图像、视频与音频...
一、摘要 Kimi K2.6 是 Moonshot AI 发布的开源多模态、Agentic 模型,主打“长时程编码 + 工具调用 + 多智能体编排”。官方披露其在多项公开基准上达到开源领先,并强调可在一次任务中完成从需求拆解、生成多文件代码到运行验证的闭环,面向真实软件工程与自动化运维场景。 二、核...
一、摘要 MiniMax-AI/skills 新增三项音乐相关开源技能: minimax-music-gen 、 buddy-sings 、 minimax-music-playlist 。它们面向 AI 代理场景,分别覆盖歌曲生成、AI 角色第一人称演唱,以及基于本地音乐偏好的歌单生成。整体依赖 ...
一、摘要 MOSS-TTS-Nano 是 OpenMOSS 与 MOSI.AI 发布的开源多语言语音生成模型,定位是“小体积、低延迟、可部署”。它约 0.1B 参数,支持实时语音生成与语音克隆,强调 CPU 友好和本地集成,适合做轻量 Demo、浏览器服务和嵌入式产品原型。 二、核心特性 1、多语言...
一、摘要 MiniMax M2.7 是 MiniMax 正式开源的文本大模型,当前已在 Hugging Face 提供模型页面与获取入口。官方信息显示,它面向软件工程、终端任务、办公生产力与 Agent 场景,在 SWE-Pro 上达到 56.22%,在 Terminal Bench 2 上达到 5...
vLLM 的热度一直很高,因为它踩中的不是“有没有聊天界面”这种上层需求,而是更底层、也更贵的那个问题:模型服务怎么跑得更快、更省显存、更能扛并发。只要你准备自己托管模型 API,而不是单纯本地玩玩,vLLM 基本都会进入候选名单。 官方仓库: https://github.com/vllm-pro...