Tencent Hunyuan 팀은 HunyuanVideo를 기반으로 하는 매우 역동적인 대화형 게임 비디오 생성 프레임워크인 오픈 소스 Hunyuan-GameCraft를 공식적으로 발표했습니다. 단일 장면 이미지와 사용자 동작 신호에서 플레이 가능하고 물리적으로 사실적인 게임 플레이 비디오를 생성할 수 있어 1인칭 또는 3인칭 시점을 지원하여 제작자와 개발자에게 새로운 "감독 스타일" 게임 제작 방법을 제공합니다.
1. 핵심 장점
1. High Dynamics
Hunyuan-GameCraft는 표준 키보드 입력을 연속 동작 공간에 균일하게 매핑하여 속도와 각도의 고정밀 제어를 달성합니다. 이 접근 방식은 복잡한 궤적을 탐구하고 기존 모델의 뻣뻣하고 제한된 움직임 문제를 돌파할 뿐만 아니라 흐르는 구름, 비와 눈 효과, 물의 흐름과 같은 역동적인 환경 콘텐츠를 생성합니다.
2. 장기적인 일관성
하이브리드 과거 조건 메커니즘은 대규모 모션 후에도 원본 장면 정보를 유지하여 비디오의 일관성과 몰입감을 보장하는 데 사용됩니다.
3. 비용 대폭 절감
값비싼 모델링 및 렌더링이 필요하지 않으며 PCM 증류 기술을 사용하여 추론 단계를 압축하고 생성 속도를 높이며 비용을 절감합니다. 양자화된 13B 모델은 RTX 4090과 같은 소비자용 그래픽 카드에서 실행할 수 있습니다.
2. 응용 시나리오
1. 게임 프로토타이핑
개발자는 대화형 비디오 프로토타입을 신속하게 생성하여 게임 플레이, 장면 역학 및 물리적 상호 작용 논리를 확인할 수 있습니다.
2. 영화 및 TV 및 가상 프로덕션
영화 및 단편 비디오 제작자는 움직임을 제어하여 역동적인 장면을 생성하여 렌더링 후 비용을 절감할 수 있습니다.
3. 교육 및 과학 연구는
물리적 시뮬레이션, 동작 궤적 연구, 몰입형 교육 콘텐츠 생성 및 기타 분야에서 사용할 수 있습니다.
3. 오픈 소스 정보 및 접근 방법
1. 프로젝트 홈페이지: https://hunyuan-gamecraft.github.io
2. 코드 저장소: https://github.com/Tencent-Hunyuan/Hunyuan-GameCraft-1.0
3. 기술 보고서: https://arxiv.org/abs/2506.17201
4. 포옹 얼굴 모델: https://huggingface.co/tencent/Hunyuan-GameCraft-1.0
자주 묻는 질문(Q&A)
Q: Hunyuan-GameCraft 실행하려면 고급 그래픽 카드가 필요합니까?
A: 공식적으로 정량화된 13B 모델은 RTX 4090과 같은 소비자 그래픽 카드에서 실행됩니다.
Q: 기존 3D 모델링 엔진과 비교하여 이 엔진의 장점은 무엇입니까?
A: 복잡한 모델링 및 렌더링 프로세스가 필요하지 않으며 생성 속도가 빠르며 이미지 및 작동 신호를 기반으로 직접 비디오를 생성할 수 있습니다.
Q: 멀티플레이어 상호 작용이 지원됩니까?
A: 현재 공식 문서는 주로 단일 사용자 대화형 비디오 생성을 보여주며 멀티플레이어 모드는 후속 버전 업데이트에 주의를 기울여야 합니다.