FunAudioLLM 开源 Fun-Audio-Chat-8B:双分辨率语音表征与语音函数调用
一、摘要 Fun-Audio-Chat-8B 是 FunAudioLLM 团队开源的“大型音频语言模型”,面向更自然、低延迟的语音交互。它采用“双分辨率语音表征”(5Hz 共享骨干 + 25Hz 精细化头部)以降低计算开销,同时通过 Core-Cocktail 训练策略尽量保留文本 LLM 能力;覆...
一、摘要 Fun-Audio-Chat-8B 是 FunAudioLLM 团队开源的“大型音频语言模型”,面向更自然、低延迟的语音交互。它采用“双分辨率语音表征”(5Hz 共享骨干 + 25Hz 精细化头部)以降低计算开销,同时通过 Core-Cocktail 训练策略尽量保留文本 LLM 能力;覆...
12月22日晚快手直播间出现色情等违规内容,平台称系黑灰产攻击并已报警。对所有直播平台来说,这类事件本质是内容安全与对抗升级:黑灰产用自动化批量投放,逼迫平台在分钟级完成识别与处置。要稳住舆情与业务,核心抓手就是AI内容安全与风控联动。 一、事件要点与平台处置 1、快手直播间异常的核心信息 AI内容...
AI代码编辑器Cursor发布2.3版本,官方将其定义为“稳定性与打磨”为主的假期更新,重点覆盖核心Agent、布局控制与代码Diff/评审体验,并表示更新将于一周内逐步推送,以降低节日期间的回归风险。 据官方说明,2.3在稳定性方面引入扩展的进程隔离,修复聊天历史记录消失等问题,自动运行行为更一致...
钉钉在“AI钉钉1.1新品发布暨生态大会”上发布AI钉钉1.1版本,代号“木兰”,并首次对外系统提出面向企业AI协作的“工作智能操作系统”Agent OS。该体系由钉钉ONE(新交互入口)、DingTalk Real(企业级AI硬件与执行环境)、AI搜问(企业级搜索问答入口)、通用任务Agent“悟...
阿里云在Model Studio更新并提供Wan2.6-Image(wan2.6-image)调用能力,定位为“可用于生产”的图像生成与编辑模型。官方资料显示,该模型支持图文交错输出,可在一次请求中生成包含文字与多张图片的内容,用于步骤化教程、故事分镜等叙事型视觉表达。 在生成与编辑层面,wan2....
LongCat API平台更新日志显示,LongCat-Flash-Chat已升级至新版本,属于能力增强类更新,模型名称与API调用方式保持不变。此次升级延续“高效率、低延迟”的定位,重点强化长上下文与开发者真实任务表现,并提升复杂工具调用与多步骤任务执行的稳定性。 更新要点包括:上下文长度提升至2...