Step-Audio-R1.1 夺冠 Speech Reasoning 排行，兼顾深度推理与实时性

Step-Audio-R1.1 夺冠 Speech Reasoning 排行，兼顾深度推理与实时性

AI资讯 • Admin • 2026/1/16 • 83 次浏览

Step-Audio-R1.1 宣布上线，并称在 Artificial Analysis 的 Speech Reasoning 榜单位列第一；在 BigBench Audio 测试中取得约96.4% 准确率，同时在实时对话场景下实现约1.51秒的首帧音频输出。项目方强调，模型在深度推理与交互时延之间取得平衡，用于更贴近真实语音对话的场景。

官方介绍称，R1.1 在推理阶段引入“测试时算力伸缩”，并强化端到端音频推理与面向音频任务优化的可扩展 CoT。模型权重已开放，可在社区平台直接下载；同时提供在线体验入口。需要注意的是，榜单评测方法与设备网络差异可能影响实际表现，具体效果仍取决于应用场景与部署条件。

常见问题

Q：Step-Audio-R1.1 是什么？

A：Step-Audio-R1.1 是面向语音对话的音频大模型，强调深度推理与低时延兼顾。

Q：Step-Audio-R1.1 有哪些成绩？

A：公开成绩包含 BigBench Audio 约96.4% 准确率与约1.51秒 TTFA，并在相关榜单列首。

Q：Step-Audio-R1.1 的技术特点是什么？

A：模型采用测试时算力伸缩、端到端音频推理与面向音频的可扩展 CoT。

Q：Step-Audio-R1.1 是否开源？

A：权重与资源已公开，可在主流社区平台获取并本地部署。

Q：Step-Audio-R1.1 可在哪里试用？

A：可通过在线演示页面体验，亦可在平台页面下载权重自行运行。

Step-Audio-R1.1上线登顶Artificial Analysis语音推理榜 Step-Audio-R1.1宣称Speech Reasoning榜第一评测可信度成焦点 Step-Audio-R1.1 BigBench Audio达96.4%准确率对话能力被放大 Step-Audio-R1.1实现1.51秒首帧输出深度推理与低时延兼顾 Step-Audio-R1.1用测试时算力伸缩让语音推理可扩展 Step-Audio-R1.1强化端到端音频推理瞄准真实语音对话 Step-Audio-R1.1可扩展CoT落地音频任务引发讨论 Step-Audio-R1.1权重开放可本地部署开源语音大模型再加码 Step-Audio-R1.1提供在线体验入口低门槛试用引流 Step-Audio-R1.1拿下榜单与TTFA数据语音智能体进入实战 Artificial Analysis榜单称Step-Audio-R1.1第一但设备差异需警惕 BigBench Audio 96.4%背后Step-Audio-R1.1真实场景仍需压测 Step-Audio-R1.1把推理深度与交互时延拉到新平衡点 Step-Audio-R1.1测试时算力伸缩意味着语音推理可按需付费 Step-Audio-R1.1端到端音频推理对比ASR+LLM链路有何优势 Step-Audio-R1.1可扩展CoT让语音任务也能分步推理 Step-Audio-R1.1声称榜一与高分数语音模型评测口径成争议 Step-Audio-R1.1 1.51秒TTFA对实时对话产品意味着什么 Step-Audio-R1.1在实时对话场景低时延表现抢眼 Step-Audio-R1.1上线：语音推理模型开始拼测试时算力伸缩 Step-Audio-R1.1开源权重公开下载部署门槛与算力需求解析 Step-Audio-R1.1在线Demo开放语音交互体验能否复现榜单成绩 Step-Audio-R1.1以Speech Reasoning榜第一冲击语音对话赛道 Step-Audio-R1.1 BigBench Audio高分加持语音推理模型热度飙升 Step-Audio-R1.1如何用可扩展CoT提升音频任务推理稳定性 Step-Audio-R1.1强调端到端音频推理减少多模块误差累积 Step-Audio-R1.1把深度推理搬到语音端交互体验更像真人 Step-Audio-R1.1权重已放出社区可复现与可对比才是关键 Step-Audio-R1.1榜单第一背后评测方法与数据分布仍待验证 Step-Audio-R1.1真实表现受网络与设备影响TTFA不宜生搬硬套 Step-Audio-R1.1用测试时算力伸缩在质量与延迟间动态取舍 Step-Audio-R1.1端到端音频推理加速语音智能体闭环 Step-Audio-R1.1可扩展CoT让语音对话也能做复杂任务推理 Step-Audio-R1.1上线即开源语音推理生态再添强玩家 Step-Audio-R1.1登顶Artificial Analysis对竞品意味着什么 Step-Audio-R1.1 96.4%准确率与1.51秒TTFA能否同时复现 Step-Audio-R1.1主打深度推理但强调交互时延控制 Step-Audio-R1.1的测试时算力伸缩是否会改变语音推理定价 Step-Audio-R1.1面向真实语音对话场景把延迟指标摆上台面 Step-Audio-R1.1上线后最大变量是部署条件与吞吐压测结果 Step-Audio-R1.1开源可用但榜单领先不等于业务稳赢 Step-Audio-R1.1语音推理榜第一引发复测呼声开发者该怎么看 Step-Audio-R1.1将音频任务CoT规模化语音推理进入新阶段 Step-Audio-R1.1端到端音频推理与工具调用工作流能否无缝衔接 Step-Audio-R1.1在线体验开放但安全与误触发风险同样重要 Step-Audio-R1.1用低TTFA抢占实时对话入口语音产品要跟上吗 Step-Audio-R1.1高分榜单叠加开源权重推动语音推理快速扩散 Step-Audio-R1.1上线：语音大模型从能听会说走向会推理 Step-Audio-R1.1把Speech Reasoning做到榜首但一致性仍看实现细节 Step-Audio-R1.1成绩亮眼却提醒：评测方法设备网络差异会左右体验

相关文章

Google DeepMind 发布 TranslateGemma：支持55种语言的开源翻译模型家族

Google DeepMind 发布 TranslateGemma：支持55种语言的开源翻译模型家族

Google DeepMind 宣布推出 TranslateGemma，一组面向机器翻译的开源模型，支持55种语言，提供 4B、12B、27B 三种参数规模。官方介绍称，这些模型基于 Gemma 3 ...

OpenAI宣布测试ChatGPT广告：覆盖免费版与Go订阅，Plus与Pro保持无广告

OpenAI宣布测试ChatGPT广告：覆盖免费版与Go订阅，Plus与Pro保持无广告

OpenAI在官方说明中表示，计划在未来数周于美国对ChatGPT的免费版与ChatGPT Go订阅进行广告测试。官方强调广告将与回答内容清晰分隔并明确标注，广告不会影响ChatGPT给出的答案；Pl...

Kimi K3正式上线：2.8万亿参数押注百万上下文与开放权重

Kimi K3正式上线：2.8万亿参数押注百万上下文与开放权重

月之暗面（Moonshot AI）正式推出 Kimi K3 。这款2.8万亿参数模型提供100万 token 上下文和原生多模态能力，已登陆 Kimi.com、Kimi Work、Kimi Code ...

Mistral Studio 新增提示词版本管理：企业 AI 开始管行为资产

Mistral Studio 新增提示词版本管理：企业 AI 开始管行为资产

2026 年 7 月 9 日，Mistral 在官方文章《Your Prompts and Skills need a system of record》中宣布，Studio 开始为 Prompts ...

推荐工具