돌아가기 AI는 오픈 소스입니다.
HY-Motion 1.0 오픈 소스 분석: 텐센트의 훈원 10억 파라미터 DiT 원셩 액션 모델 입문 가이드

HY-Motion 1.0 오픈 소스 분석: 텐센트의 훈원 10억 파라미터 DiT 원셩 액션 모델 입문 가이드

AI는 오픈 소스입니다. Admin 287 회 조회

1. 초록

HY-Motion 1.0은 Tencent Hunyuan에서 개발한 일련의 텍스트-모션 모델로, 확산 변환기(DiT)와 플로우 매칭을 기반으로 하며, 자연어 설명을 기반으로 한 골격 기반 3D 캐릭터 애니메이션 시퀀스를 생성하고, 이를 일반적인 DCC/엔진 애니메이션 파이프라인과 연결하여 리디렉션과 자산화를 수행할 수 있습니다. 이 프로젝트는 표준(약 1.0B 파라미터)과 경량 버전(약 0.46B 파라미터)을 모두 제공하며, 의미적 정렬과 물리적 자연성을 향상시키기 위한 훈련에 "사전 학습 → 고품질 미세 조정 → 강화 학습" 전체 링크를 사용합니다.

2. 핵심 특징

1. 10억 규모 DiT + 플로우 매칭: DiT 스타일 플로우 매칭 생성 프레임워크를 10억 매개변수로 확장하여 더 강력한 명령어 이해와 액션 품질을 목표로 합니다.

2. 모든 단계에서 폐쇄 루프 훈련: 대규모 사전 학습은 일반적인 행동 사전에 학습한 후, 고품질 데이터로 세부 사항과 부드러움을 세밀하게 조정하며, 마지막으로 인간 피드백과 보상 모델과 관련된 강화 학습을 통해 텍스트 의미론과 행동의 자연성을 더욱 정렬합니다.

3. 풍부한 카테고리 커버리지: 데이터 파이프라인을 정리하고 주석을 달면 6개의 카테고리와 200+ 액션 카테고리를 커버하여 보다 '사용적인' 액션 라이브러리를 쉽게 구축할 수 있습니다.

4. 엔지니어링 추론 및 선택적 프롬프트 향상: 로컬 배치 추론 스크립트와 Gradio 인터페이스를 제공; 또한 선택적으로 "지속 시간 예측 및 프롬프트 재작성" 모듈을 지원하며(활성화하지 않으면 관련 매개변수를 명시적으로 꺼야 합니다).

3. 설치

  1. PyTorch 설치 (공식 가이드라인에 따라 CUDA/CPU 버전 선택).

2. 코드 풀 및 의존성 설치: 저장소를 git clone 후 디렉터리에서 pip install -r requirements.txt을 실행합니다.

3. 가중치 다운로드: 저장소 ckpts/README.md의 지침에 따라 지정된 디렉터리(표준 버전 또는 라이트 버전)에 모델 가중치를 배치합니다.

4. 추론 실행: 로컬 배치 생성에 local_infer.py를 사용하세요(해당 가중치 디렉터리를 --model_path 통해 가리키세요).

5. 시각화 시작: gradio_app.py를 실행하여 로컬 웹 인터페이스를 열어 인터랙티브 미리보기와 테스트를 진행합니다.

4. 일반적인 사용 사례

  1. 게임 및 애니메이션 프리패브레이션: 자연어를 사용해 액션 초안을 빠르게 생성하여 스토리보드에서 액션 라이브러리까지의 반복 주기를 단축합니다.
  2. 디지털 인간/가상 앵커 액션 라이브러리: 스타일, 리듬, 감정 명령에 따라 자료를 묶음으로 생성한 후, 뼈 방향 전환과 청소를 통합적으로 수행합니다.
  3. DCC/엔진 파이프라인 접근: 생성된 스켈레톤 액션을 Blender/Maya 또는 Unity/Unreal에 가져오고, IK, 리디렉션, 커브 편집을 통해 재사용 가능한 자산으로 구현합니다.
  4. 데이터 향상 및 검색 지원: 액션 생성기로서 롱테일 액션 설명의 범위를 확장하거나, "텍스트-액션" 정렬을 위한 검색 및 주석 처리 프로세스를 구축하는 데 사용됩니다(수동 무작위 검사 필요).

5. 생태와 경쟁 제품

  1. 생태학적 위치: HY-Motion 1.0은 "텍스트 → 3D 인간 움직임" 링크에 맞춰져 있으며, SMPL/SMPLH 관련 인간 표현, DCC 툴체인, 프롬프트 엔지니어링 모듈과 결합하여 "생산 가능한" 액션 자산 프로세스를 형성할 수 있습니다.
  2. 오픈 소스 경쟁사 참고 자료: MDM(인간 움직임 확산 모델), T2M-GPT, 초기 텍스트-모션 베이스라인 및 HumanML3D 데이터/벤치마크가 커뮤니티에서 널리 사용되고 있습니다. HY-Motion 1.0의 주요 차이점은 1B 척도와 더 완전한 훈련 폐쇄 루프입니다. 여전히 신속한 배치, 캐릭터 골격, 그리고 착륙 파이프라인에 따라 실제 장단점을 비교하고 평가하는 것이 권장됩니다.

6. 제한 및 주의사항

  1. 연산 능력과 지연 시간: 10억 매개변수 추론은 비디오 메모리와 처리량에 대한 요구가 더 높으며, 자원이 제한된 시나리오에서는 라이트 버전을 우선시할 수 있습니다.
  2. 골격과 캐릭터의 차이점: 생성되는 것은 골격 주도의 동작이며, 특정 캐릭터에 착지하려면 보통 방향 전환, 골길이 적응, 발바닥 슬라이딩 스텝 보정, 그리고 간간이 보정이 필요합니다.
  3. 프롬프트 재작성/지속 시간 예측 의존성: 관련 모듈이 활성화되어 있다면, 사용 가능한 서비스 주소나 로컬 모델을 구성해야 합니다. 그렇지 않으면 해당 매개변수를 꺼서 오류를 피해야 합니다.
  4. 카테고리 및 데이터 편향: 200+ 클래스 커버리지가 "어떤 설명도 안정적"이라는 의미는 아니며, 복잡한 상호작용, 소품, 다수 인물 상황에서는 추가 제약 조건이나 후처리가 필요할 수 있습니다.
  5. 라이선스 및 준수: 가중치와 코드는 특정 커뮤니티에서 라이선스를 부여하며, 상업화/배포 전에 약관을 꼼꼼히 확인해야 하며, 생성된 콘텐츠에 대해 저작권 및 보안 검토를 실시해야 합니다.

7. 프로젝트 주소

https://github.com/Tencent-Hunyuan/HY-Motion-1.0

8. 자주 묻는 질문

Q: HY-Motion 1.0 설치 후 local_infer.py 실행 시 duration_est/재작성 관련 오류를 어떻게 처리하나요?

A: 프롬프트 오버라이드/지속 시간 예측 모듈의 서비스 주소나 로컬 가중치를 설정하지 않으면, 추론 매개변수의 해당 기능(예: duration_est 비활성화 및 재작성)을 끄거나 저장소 지침에 따라 모듈을 올바르게 설정해야 합니다.

Q: HY-Motion-1.0과 HY-Motion-1.0-Lite 중에서 어떻게 선택하나요?

A: 더 높은 동작 품질과 강력한 명령어 추종을 추구할 때 표준 버전을 선택하고, 충분한 연산 능력을 갖추어야 합니다; 자원 사용량을 줄이거나 반복 속도가 빨라질 때는 먼저 Lite를 사용하고 그 다음 표준 에디션으로 키 조각을 복제하세요.

Q: HY-Motion 1.0의 출력물이 Blender/UE/Unity 애니메이션 파이프라인과 어떻게 연결되나요?

A: 일반적인 과정은 생성된 스켈레톤 액션을 툴체인에서 읽을 수 있는 형식으로 내보내거나 변환한 후, 본을 대상 캐릭터 리그로 리디렉션한 뒤, IK, 솔 락킹, 곡선 스무딩 같은 후처리를 수행하는 것입니다. 프로젝트 프레임워크 표준마다 다르며, 안정적인 리디렉션 템플릿을 구축해야 합니다.

Q: HY-Motion 1.0이 '소품/멀티플레이어/복잡한 장면이 있는 액션'에 적합한가요?

A: 주로 싱글 플레이어 3D 인간 모션 생성을 목표로 합니다; 복잡한 상호작용은 종종 더 강력한 조건부 입력, 후처리, 또는 전문 데이터 지원이 필요하므로, 소규모 검증을 먼저 수행하고 수동 수정 준비를 하는 것이 권장됩니다.

HY-Motion 1.0 오픈 소스 텍스트-3D 모션 생성 모델 파싱 텐센트 훈위안 HY-Motion 1.0 파라미터 척도와 클로즈드 루프 훈련에 대한 상세 설명 DiT와 플로우 매칭을 기반으로 한 텍스트 기반 인간 움직임 생성 HY-Motion 1.0 스탠다드 vs. 라이트 에디션 선택 및 비교 가이드 자연어부터 골격 애니메이션까지, HY-Motion 1.0은 파노라마 뷰를 적용합니다 HY-Motion 1.0 사전 훈련, 미세 조정, 강화 학습, 3단계 훈련 해석 HY-Motion 1.0은 데이터 파이프라인 하이라이트의 200+ 액션 카테고리를 다룹니다 HY-Motion 1.0 추론 스크립트 및 Gradio 시각화 튜토리얼 HY-Motion 1.0 게임 내 애니메이션 프리패브케이션으로 빠르게 모션을 생성하는 방법 디지털 휴먼 액션 라이브러리는 HY-Motion 1.0의 실용적인 솔루션을 배치별로 생성합니다 HY-Motion 1.0은 Blender 애니메이션 파이프라인의 구현 과정에 통합되어 있습니다 HY-Motion 1.0이 Maya 리디렉션 및 곡선 최적화 가이드에 접근하다 HY-Motion 1.0은 Unity 애니메이션 자산화 전체 경로와 연결됩니다 HY-Motion 1.0은 언리얼 엔진의 리디렉션과 IK 트릭과 연결되어 있습니다 HY-Motion 1.0과 MDM 및 기타 오픈 소스 경쟁자들의 비교 및 평가 지점 HY-Motion 1.0과 T2M-GPT의 차이점 및 선택 제안 HY-Motion 1.0과 HumanML3D 벤치마크 간의 관계 및 참조 HY-Motion 1.0 모션 품질 향상을 위한 공학적 추론 전략 HY-Motion 1.0으로 프로덕션 준비가 된 모션 자산 흐름을 구축하는 방법 HY-Motion 1.0 스켈레톤 드라이브 출력에 대한 리디렉션 고려사항 HY-Motion 1.0 보정 및 간헐 보정 정상법 HY-Motion 1.0 연산 능력 요구사항 및 추론 지연 최적화 제안 자원이 제한된 상황에서는 HY-Motion 1.0 Lite 전략이 선호됩니다 HY-Motion 1.0 프롬프트 재작성 및 지속 시간 예측 모듈 구성 가이드 local_infer 잘못된 HY-Motion 1.0 솔루션을 duration_est 보고했습니다 HY-Motion 1.0은 재작성 및 duration_est 매개변수 연습을 끕니다 HY-Motion 1.0 PyTorch 설치 완료 단계 HY-Motion 1.0 무게 다운로드 및 ckpts 디렉터리 배치 지침 HY-Motion 1.0 로컬에서 배치 생성을 위한 명령줄 예시 HY-Motion 1.0 Gradio 인터페이스 인터랙티브 미리보기 및 테스트 팁 HY-Motion 1.0 액션 카테고리 적용 및 롱테일 데이터 향상 체계 HY-Motion 1.0은 텍스트 액션 검색 및 주석 작성에 사용됩니다 HY-Motion 1.0 단일 사용자 모션 생성을 위한 능력 경계 명세서 HY-Motion 1.0 멀티플레이어 상호작용 및 소품 행동의 제한 및 대안 복잡한 장면 동작 생성을 위한 HY-Motion 1.0 제약 조건과 후처리 아이디어 HY-Motion 1.0 라이선스 및 상업 준수 체크리스트 HY-Motion 1.0은 콘텐츠 저작권 및 안전 검토 관행 권고사항을 생성합니다 HY-Motion 1.0 행동 의미 정렬이 RLHF 핵심 사항을 개선하다 HY-Motion 1.0의 고품질 미세 조정 데이터가 부드러움을 향상시키는 방법 HY-Motion 1.0 운동의 자연성과 물리적 합리성 평가 방법 HY-Motion 1.0과 DCC 툴체인 조합의 생태학적 위치 해석 HY-Motion 1.0은 액션 라이브러리의 카테고리 시스템과 관리 방식을 구축합니다 HY-Motion 1.0 프롬프트 작성 및 리드미컬한 감정 조절 기술 HY-Motion 1.0 공학 추론 배치 처리 및 로그 디버깅 전략 HY-Motion 1.0 스탠다드 에디션 1B 모델 및 0.46B Lite 성능 분석 게임 개발에서 HY-Motion 1.0의 반복적 효율성 향상을 위한 사례 아이디어 HY-Motion 1.0은 스토리보드에서 액션 라이브러리까지 워크플로우 설계를 자동화합니다 HY-Motion 1.0 골길이 적응 및 재방향 템플릿 설정 가이드 HY-Motion 1.0 프로젝트 주소와 오픈 소스 리소스가 빠르게 색인화됩니다

추천 도구

더보기