中文业务适配

找到 1 篇相关文章

从 MMSU 到 MMAU-Pro：MiMo-Audio-7B-Instruct 如何拿下音频理解 SOTA

开源音频大模型 MiMo-Audio 宣称在百百万小时级别的预训练后，实现跨任务少样本泛化，并在 MMSU、MMAU、MMAR、MMAU-Pro 等基准上取得领先。对内容审核、智能客服、播客检索、会议纪要、语音体感游戏等场景，MiMo-Audio 的通用音频理解与推理能力值得立刻关注与验证。一、这...

AI资讯 • Admin • 2025/9/20

中文业务适配

从 MMSU 到 MMAU-Pro：MiMo-Audio-7B-Instruct 如何拿下音频理解 SOTA

推荐工具

提交AI工具

请确认提交信息