Step-Audio-R1.1 夺冠 Speech Reasoning 排行,兼顾深度推理与实时性
Step-Audio-R1.1 宣布上线,并称在 Artificial Analysis 的 Speech Reasoning 榜单位列第一;在 BigBench Audio 测试中取得约96.4% 准确率,同时在实时对话场景下实现约1.51秒的首帧音频输出。项目方强调,模型在深度推理与交互时延之间...
Step-Audio-R1.1 宣布上线,并称在 Artificial Analysis 的 Speech Reasoning 榜单位列第一;在 BigBench Audio 测试中取得约96.4% 准确率,同时在实时对话场景下实现约1.51秒的首帧音频输出。项目方强调,模型在深度推理与交互时延之间...
Google DeepMind 宣布推出 TranslateGemma,一组面向机器翻译的开源模型,支持55种语言,提供 4B、12B、27B 三种参数规模。官方介绍称,这些模型基于 Gemma 3 架构,重点在于提升翻译任务表现,同时兼顾在手机、笔记本与云端等不同算力环境中的部署效率。 相关技术报...
OpenAI 开发者社区发布帖介绍 Open Responses:一套受 OpenAI Responses API 启发的开源规范与生态,目标是为多提供方的大语言模型提供可互操作的统一接口,减少不同模型平台之间反复“对接翻译”的成本,并支持流式输出与工具调用等通用能力。 公开说明称,该规范以“多提供...
2026年1月15日,苹果宣布拓展中国大陆用户的Apple Pay跨境支付支持:符合条件的本地银行发行Visa信用卡/借记卡可添加到“钱包”后,在境外支持免接触式支付的线下商户及线上场景使用Apple Pay完成支付。首批支持的发卡行包括工行、中行、农行、交行、招行、中信、平安、兴业等的Visa信用...
美团LongCat团队发布并上架“LongCat-Flash-Thinking-2601”,定位为面向“深度与通用代理式思考”的版本,主打在Agentic Search、Agentic Tool Use与工具整合推理等任务上的高分表现,并宣称在随机复杂任务中具备更强泛化能力。该版本已提供网页端试用与...
PixVerse Research发布PixVerse-R1技术文章,并上线“Real-time Generate”相关页面,称R1为“实时世界模型”,可将视频生成从固定时长片段扩展为可持续、可交互的视觉流,画面会随用户输入即时变化。官方同时宣称其可实现最高1080P的实时生成体验,并将其定位为互动...