返回Ai开源
腾讯混元开源 Hunyuan-GameCraft:高动态交互式游戏视频生成框架

腾讯混元开源 Hunyuan-GameCraft:高动态交互式游戏视频生成框架

Ai开源 Admin 4 次浏览


腾讯混元团队正式宣布开源 Hunyuan-GameCraft,这是基于 HunyuanVideo 打造的高动态交互式游戏视频生成框架。它能够从一张场景图片和用户操作信号生成可玩且物理真实的游戏视频,支持第一人称或第三人称视角,为创作者和开发者提供全新“导演式”游戏制作方式。


一、核心优势

1、高动态性

Hunyuan-GameCraft 将标准键盘输入统一映射到连续动作空间,实现对速度与角度的高精度控制。这种方式不仅能探索复杂轨迹,突破传统模型动作僵硬、受限的问题,还可以生成动态环境内容,如流动的云层、雨雪效果和水流等。

2、长期一致性

采用混合历史条件机制,在发生大幅度运动后仍能保留原始场景信息,保证视频的一致性与沉浸感。

3、显著降低成本

无需昂贵的建模与渲染,使用 PCM 蒸馏技术压缩推理步骤,提高生成速度并降低成本。经过量化处理的 13B 模型可以在消费级显卡(如 RTX 4090)上运行。


二、应用场景

1、游戏原型设计

开发者可快速生成可交互的视频原型,用于验证玩法、场景动态效果与物理交互逻辑。

2、影视与虚拟制作

电影和短视频创作者可通过控制动作生成动态镜头,减少后期渲染成本。

3、教育与科研

可用于物理模拟、运动轨迹研究、沉浸式教育内容生成等领域。


三、开源信息与获取方式

1、项目主页https://hunyuan-gamecraft.github.io

2、代码仓库https://github.com/Tencent-Hunyuan/Hunyuan-GameCraft-1.0

3、技术报告https://arxiv.org/abs/2506.17201

4、Hugging Face 模型https://huggingface.co/tencent/Hunyuan-GameCraft-1.0


常见问题解答(Q&A)

Q:Hunyuan-GameCraft 需要高端显卡才能运行吗?

A:官方说明,经过量化的 13B 模型可在 RTX 4090 等消费级显卡上运行。

Q:它和传统 3D 建模引擎相比有何优势?

A:无需复杂建模和渲染流程,生成速度快,且能直接基于图片和操作信号生成视频。

Q:是否支持多人交互?

A:目前官方文档主要展示单用户交互视频生成,多人模式需关注后续版本更新。

推荐工具

更多