阿里巴巴发布新一代通义万相2.6(Wan 2.6)系列模型,面向专业影视制作与图像创作场景升级,并已同步上线阿里云百炼与万相相关入口。新版本主打“角色扮演”与多镜头叙事:可参考输入视频中的角色外观与音色,按提示词生成单人、多人或人与物合拍视频,并将简单提示词扩写为多分镜脚本,尽量保持跨镜头主体与场景一致。
能力细节上,万相2.6强调自然音画同步与更稳定的多人对话,兼顾音乐与歌曲生成;视频生成最长可达15秒(部分参考生成形态标注为10秒),并支持“音频驱动”以文本与音频带动多镜头演绎。阿里云页面同时给出API侧的计费提示,相关视频模型调用价格标注为0.6元/秒起,实际费用、配额与可用能力以平台控制台与产品说明为准。
随着可控分镜、角色外观与声音迁移能力增强,创作门槛确实被进一步降低,但也更需要注意肖像权、声音权与版权合规;在使用真实人物形象、配音或品牌元素时,建议确保授权与可追溯素材来源,避免引发侵权或误导传播风险。
常见问题
Q:通义万相2.6(Wan 2.6)是什么产品?
A:它是阿里通义体系下的新一代图像与视频生成模型系列,面向影视级创作做了能力升级。
Q:万相2.6的“角色扮演功能”指什么能力?
A:模型可参考输入视频中的角色外观与音色,再按提示词生成单人、多人或人与物合拍的视频内容。
Q:万相2.6的“多镜头叙事”和“智能分镜”怎么用?
A:输入较简单的提示词后,模型可生成多分镜脚本并产出包含多个镜头的连贯视频,同时尽量保持跨镜头一致性。
Q:万相2.6最长能生成多长视频,是否支持音画同步?
A:公开视频信息显示最长可生成15秒视频,并强调多人对话稳定生成与更自然的音画同步效果。
Q:万相2.6的使用费用和风险点有哪些?
A:平台页面标注部分API调用价格0.6元/秒起;使用时需关注配额与计费规则,并注意肖像权、声音权与版权授权问题。