OpenAI Codex上线Agent Skills,支持$.skill-name调用与自动选用
OpenAI 开发者文档显示,Codex 现已支持“Agent Skills(技能)”,用于把特定任务的指令、资源与可选脚本打包成可复用能力,并可在 Codex CLI 与 IDE 扩展中使用。用户既可通过 $.skill-name 显式调用某个技能,也可在提示词中描述需求,让 Codex 自动选择...
OpenAI 开发者文档显示,Codex 现已支持“Agent Skills(技能)”,用于把特定任务的指令、资源与可选脚本打包成可复用能力,并可在 Codex CLI 与 IDE 扩展中使用。用户既可通过 $.skill-name 显式调用某个技能,也可在提示词中描述需求,让 Codex 自动选择...
近期,语音与视频人工智能领域迎来多项技术发布,多模态生成模型 Wan2.6 以及语音模型 Fun-ASR、Fun-CosyVoice 3 相继公布,引发创作者与开发者关注。相关模型主打在角色外观、声音与叙事风格上的一致性表现,目标是提升视频内容的电影化效果与整体表达能力。 据介绍,Wan2.6 被定...
Gemini 3 Flash正作为Google Search“AI Mode”的默认模型在全球范围陆续上线。官方称,新模型在保持搜索速度的同时提升推理与理解能力,面向更复杂的多条件问题、对比与规划类需求,可输出更结构化、可读性更强的回答,并继续提供来自网页的实时信息与可点开的相关链接。 此次更新意味...
一、开源与获取 MiMo 已开放权重与配套资料。优先在 Hugging Face 的 XiaomiMiMo 组织页获取模型(含 MiMo-V2-Flash/Base 等),技术报告与部分代码在 GitHub;也提供在线 Studio 与 API 平台入口。 二、技术架构与数据 MiMo-V2-Fla...
OpenAI正式发布GPT-5.2 Codex,这是GPT-5系列中专注于编程与软件工程场景的代码模型版本。官方介绍称,该模型在代码生成、理解、调试与重构等核心能力上较此前版本有所提升,目标是更好地服务真实开发环境中的复杂需求,而不仅限于单段代码补全。 GPT-5.2 Codex被定位为“工程导向”...
Meta旗下AI at Meta宣布开源Perception Encoder Audiovisual(PE-AV),并将其定位为推动SAM Audio达到前沿音频分离效果的关键技术引擎。PE-AV基于更早发布的Perception Encoder体系,将音频与视觉感知进行原生融合,用于在同一表示空间...