Qwen-Image-Edit-2509 上线:多图编辑与一致性大幅升级,面向创作者与设计师
Qwen 团队发布 Qwen-Image-Edit-2509,为 Qwen-Image-Edit 的月度重构版,聚焦多图编辑与单图一致性。多图模式可拖入“人+产品”“人+场景”等最多 1–3 张参考图,模型在合成时保持主体与材质连贯,减少错位与“拼接感”。在单图编辑中,人脸跨姿势与风格保持身份一致,...
Qwen 团队发布 Qwen-Image-Edit-2509,为 Qwen-Image-Edit 的月度重构版,聚焦多图编辑与单图一致性。多图模式可拖入“人+产品”“人+场景”等最多 1–3 张参考图,模型在合成时保持主体与材质连贯,减少错位与“拼接感”。在单图编辑中,人脸跨姿势与风格保持身份一致,...
阿里通义团队宣布推出新一代文本转语音模型 Qwen3-TTS (含 Qwen3-TTS-Flash 变体),主打多音色(multi-timbre)、多语种与多方言合成,强调更自然、富有表现力的语音输出。官方演示与博客显示,模型在英文与中文场景表现突出,并新增统一架构以在同一模型内覆盖多语与多方言。当...
OpenAI 发布「Why we built the Responses API」阐述设计取向:Responses 以“推理-行动-反馈”的状态化循环取代单回合对话,允许模型在多轮中保留内部推理状态,并一次返回多种“项目”(消息、函数调用、结构化输出等),适配文本、图像、音频与函数调用等多模态交互。...
Orchids 官方宣布上线 Import in Orchids :用户可将 Lovable、Bolt、v0 或 GitHub 的任意项目直接导入 Orchids,并在同一处继续开发与迭代。公告同时强调,为鼓励迁移与试用, 凡导入项目的用户将自动获得 500k 免费积分 ,用于平台内运行与生成相关消...
Google 宣布推出 AP2(Agent Payments Protocol),定位为面向 AI 助手/Agent 的开放共享支付协议。AP2 通过“授权书(Mandates)”与可验证凭证(VC)提供可审计的用户同意证据,目标解决 AI 代购中的授权、真实性与问责问题,避免各家自建导致的互操作性...
Google 宣布上线 Gemini for Google TV,可在电视端进行更自然的对话式交互,用于寻找合适的电影与剧集、头脑风暴家庭旅行或获得学习辅导。用户可通过“Hey Google”或按下遥控器麦克风按钮唤起,保留既有 Google Assistant 指令能力的同时,新增上下文理解与多轮...