Qwen3-Omni-Flash 发布 2025-12-01 版升级 多模态会话全面强化
阿里云通义千问团队推出 Qwen3-Omni-Flash 2025-12-01 版本,对视音频对话、语音交互与多语言处理进行了大幅升级。新版本在多轮视频与音频理解上更贴近自然对话,可以连续跟踪场景与语境变化,同时通过系统提示词支持定制对话人格,适配角色扮演、虚拟助手等差异化应用场景。 在语言和语音方...
阿里云通义千问团队推出 Qwen3-Omni-Flash 2025-12-01 版本,对视音频对话、语音交互与多语言处理进行了大幅升级。新版本在多轮视频与音频理解上更贴近自然对话,可以连续跟踪场景与语境变化,同时通过系统提示词支持定制对话人格,适配角色扮演、虚拟助手等差异化应用场景。 在语言和语音方...
智谱 AI 发布新一代语音识别产品系列 GLM-ASR,并同步推出桌面端「智谱 AI 输入法」,将语音识别与大模型能力深度融合,主打“说话即可下指令”的人机交互方式。GLM-ASR 系列包含云端模型 GLM-ASR-2512 和端侧模型 GLM-ASR-Nano-2512,覆盖从服务器到笔记本、手机...
法国人工智能公司 Mistral AI 宣布推出新一代编码模型家族 Devstral 2,并同步发布原生命令行工具 Mistral Vibe。Devstral 2 提供两个开源版本:面向高算力场景的大模型,以及更适合本地部署的 Devstral Small 2,定位于软件工程和代码代理任务,强调在真...
Soft Adaptive Policy Optimization(SAPO)算法论文在 arXiv 上发布,随后 Qwen 团队通过官方博客系统介绍这一面向大语言与多模态模型的强化学习训练方法。研究指出,现有基于硬截断(hard clipping)的策略优化在重要性比极端波动时要么梯度消失,要么梯...
OpenAI 宣布,与 Anthropic 及 Block 共同在 Linux 基金会旗下发起成立 Agentic AI Foundation(AAIF),以推动智能体(agentic AI)相关的开放、可互操作技术标准和生态建设。该基金会旨在为不同厂商与开源社区提供中立平台,让各类 AI 智能体在...
OpenAI 宣布任命 Denise Dresser 为公司首席营收官(Chief Revenue Officer),负责统筹全球营收战略以及企业客户成功相关业务。官方介绍称,OpenAI 正处于高速增长阶段,已成为“历史上增长最快的商业平台”之一,新任高管将重点推动企业将 AI 更大规模地融入日常...