Matrix-Game 2.0 是由 Skywork AI 发布的开源生成式世界模型(Generative World Model),核心亮点是仅用 1.8B 参数,就能在约 640×352 分辨率下,以 25 FPS 实时生成分钟级别的可交互游戏场景,并支持通过 WASD 键盘操作进行控制。这一成果让 AI 生成世界从理论走向了可玩性落地。
一、Matrix-Game 2.0 的核心优势
- 轻量高效:参数量仅 1.8B,但通过 Few-step Auto-regressive Diffusion 技术,实现 25 帧每秒的稳定输出,支持分钟级连续生成。
- 交互性强:内置键盘/鼠标动作注入机制,用户的实时操作会影响接下来生成的每一帧画面。
- 训练数据丰富:基于 Unreal Engine 与 GTA5 等游戏引擎生成约 1200 小时高质量交互视频,用于模型训练。
二、Matrix-Game 2.0 的性能表现
- 在 GameWorld Score 基准测试中,图像质量、时序一致性、动作响应准确度等指标均优于同类开源模型 Oasis。
- 操作延迟低,交互反馈流畅,适合演示和研究实时世界模型的潜力。
三、当前的限制与不足
- 分辨率较低:官方 Demo 视频分辨率为 640×352,更接近复古 CRT 显示器的画面质感。
- 运行要求较高:需安装 FlashAttention 与 NVIDIA Apex 才能实现流畅渲染,高端 GPU 更适合运行。
四、为什么值得关注 Matrix-Game 2.0
- 完全开源:提供模型权重与代码,MIT 许可证,适合科研与二次开发。
- 落地性强:将生成式世界模型与实时可控交互结合,展示了未来 AI 游戏与虚拟世界的可能路径。
常见问题解答
Q: Matrix-Game 2.0 可以直接商用吗?
A: 模型采用 MIT 开源许可,可在遵守协议的前提下商用,但需注意生成内容的合规性。
Q: 分辨率可以提升吗?
A: 理论上可通过更高分辨率训练或超分辨率后处理实现,但会增加计算成本。
Q: 除了游戏还能用在什么场景?
A: 可用于虚拟训练环境、机器人模拟、视觉研究等需要实时生成动态画面的场景。
开源地址:
https://huggingface.co/Skywork/Matrix-Game-2.0