从 MMSU 到 MMAU-Pro:MiMo-Audio-7B-Instruct 如何拿下音频理解 SOTA 开源音频大模型 MiMo-Audio 宣称在百百万小时级别的预训练后,实现跨任务少样本泛化,并在 MMSU、MMAU、MMAR、MMAU-Pro 等基准上取得领先。对内容审核、智能客服、播客检索、会议纪要、语音体感游戏等场景,MiMo-Audio 的通用音频理解与推理能力值得立刻关注与验证。 一、这... AI资讯 • Admin • 2025/9/20 49