Retour à L’IA est open source
Interprétation open source HY3D-Bench : ensemble de données 3D de haute qualité 252K et système d’évaluation unifié

Interprétation open source HY3D-Bench : ensemble de données 3D de haute qualité 252K et système d’évaluation unifié

L’IA est open source Admin 120 vues

1. Résumé

HY3D-Bench est un écosystème unifié de données d’actifs 3D open source, développé par l’équipe Hunyuan de Tencent, dans le but d’atténuer les points de douleur courants comme la « rareté des données, le bruit élevé et l’évaluation incohérente » dans le domaine de la génération 3D. Le projet publie simultanément trois types de sous-ensembles de données complémentaires : Plein niveau (252K+ objets complets), Part-level (décomposition structurelle au niveau des composants 240K+) et Synthétique (125K+ catégories AIGC synthétique à longue traîne), et fournit un modèle de base léger et reproductible, Hunyuan3D-Shape-v2-1 Small (0,8B).

2. Caractéristiques principales

  1. Qualité prête à l’entraînement : La maille est nettoyée, normalisée et étanche/traitée pour réduire le bruit d’entraînement tel que le non-collecteur ou le cassage de trous.
  2. Format et métadonnées unifiés : Différents sous-ensembles sont plus cohérents dans l’organisation des fichiers et les champs, ce qui facilite la construction de pipelines de données et de processus d’évaluation.
  3. Objets complets de niveau complet : y compris des maillages étanches, des rendus multi-vues et des points d’échantillonnage, adaptés à la vue unique à la 3D, à la reconstruction et à la formation générationnelle.
  4. Décomposition au niveau des composants au niveau des pièces : Fournir des étiquettes de composants, des maillages indépendants des composants et le rendu des assemblages de composants, et soutenir la génération contrôlable fine, l’édition de structure et la recherche liée aux opérations robotiques.
  5. Complétion synthétique à longue queue : Couvre 1 252 sous-classes fines, ciblant le déséquilibre des catégories et la généralisation à longue traîne, adapté à l’augmentation des données et à la supplémentation d’évaluation zéro tir.
  6. Référence légère : Fournit une base de forme DiT à l’échelle 0,8B (version 2048/4096 jetons) pour abaisser le seuil des expériences de reproductibilité.

3. Installation

  1. Préparation de l’environnement : Il est recommandé d’utiliser Linux + Python (avec PyTorch/piles d’apprentissage profond courantes) et de réserver suffisamment de disques (Complet environ 11 To, Partie environ 5 To, Synthétique environ 6,5 To).

2. Obtenir des données (recommandé) : Après avoir installé la CLI Hugging Face, utilisez hf download pour extraire la totalité ou télécharger par sous-ensembles.

  1. Reproduction de base : cloner le dépôt, installer les dépendances selon la description du répertoire de baselines, et configurer le chemin des données pour lancer le script d’entraînement/évaluation.

4. Cas d’usage typiques

  1. 3D ensemble d’entraînement de génération : une source unifiée de données d’entraînement pour les modèles de génération 3D tels que diffusion/GAN/autorégression.
  2. Vue unique/multi-vue vers 3D : Reconstruction et évaluation avec perspective de rendu standardisée et supervision géométrique.
  3. Édition contrôlable et cohérence structurelle : utiliser des grilles et des étiquettes au niveau des composants pour « générer/remplacer/réassembler par pièce ».
  4. Bibliothèque robotique et d’actifs de simulation : support de l’apprentissage par accessibilité financière, planification de saisie et simulation interactive avec décomposition de composants.
  5. Équilibre de longue traîne et de catégorie : utiliser des actifs synthétiques pour compléter des catégories rares afin d’améliorer la robustesse et l’explicabilité des expériences de comparaison de généralisation.

5. Écologie et produits concurrents

  1. Écologie : GitHub fournit des descriptions de données et du code de référence ; Hugging Face offre l’hébergement de jeux de données et des téléchargements de poids de base pour une reproductibilité facile dans la communauté.
  2. Produits/contrôles concurrents : les bibliothèques d’actifs 3D courantes ou les jeux de données 3D à grande échelle sont suffisants en termes d’échelle, mais il peut y avoir des problèmes tels que du bruit, une granularité structurelle insuffisante et des calibres d’évaluation différents. La différence entre HY3D-Bench réside dans la combinaison de « nettoyage prêt à l’entraînement + structure au niveau des composants + complétion synthétique à longue traîne + référence légère reproductible ». Les avantages et inconvénients réels sont toujours recommandés en fonction de vos indicateurs de tâche et de vos expériences d’ablation.

6. Limitations et précautions

  1. Coûts élevés de stockage et de bande passante : Le volume total de données est important, il est donc recommandé de télécharger et d’entraîner par étapes par sous-ensemble/à la demande.
  2. Licences et conformité : Les données peuvent provenir d’un traitement et d’une redistribution multi-sources, il faut donc lire le fichier de licence du dépôt ainsi que les instructions source/distribution pour chaque sous-ensemble afin de confirmer les frontières entre l’utilisation commerciale et la redistribution.
  3. Champ d’application de l’étiquetage des composants : la définition et la granularité des composants peuvent varier selon les catégories, et les indicateurs de conception doivent être soigneusement conçus lors de la généralisation inter-classes ou de l’évaluation de la cohérence structurelle.
  4. Biais des données synthétiques : les actifs de l’AIGC peuvent provoquer des changements de distribution de style, et il est recommandé de les ablaire avec des ratios de mélange de données réels et des stratégies de rééchantillonnage par catégorie.

7. Adresse du projet

https://github.com/Tencent-Hunyuan/HY3D-Bench

8. Questions fréquemment posées

Q : Quels sous-ensembles (niveau complet/niveau partiel/synthétique) sont inclus dans l’ensemble de données HY3D-Bench ?

R : Le niveau plein fournit 252K+ objets étanches complets avec des points de rendu/échantillonnage ; Le niveau partie fournit 240K+ de décomposition et de rendu d’assemblage au niveau des pièces ; Synthétique propose 125 000+ actifs synthétiques répartis dans 1 252 sous-classes fines.

Q : Comment puis-je télécharger HY3D-Bench pour gagner de l’espace ?

R : Préfèrent utiliser la méthode d’inclusion par chemin de Hugging Face pour ne tirer que full/**, part/** ou synthetic/**, et commencer par un petit sous-ensemble ou un ensemble de validation.

Q : Quelle est la relation entre la référence Hunyuan3D-2.1-Small / Hunyuan3D-Shape-v2-1 Small ?

R : L’article mentionne l’utilisation de Hunyuan3D-2.1-Small pour la vérification empirique ; La page de données fournit également un poids de référence de forme légère (0,8B) basé sur l’entraînement de niveau complet. Il est recommandé de choisir les paramètres de l’expérience de reproduction en fonction de la description des bases du dépôt.

Q : Les données au niveau des parties peuvent-elles être « générées/éditées par pièce » ?

R : Elle peut servir de référence de supervision et d’évaluation de formation (étiquette de pièce + maillage de pièce + rendu d’assemblage), mais la différence de définition et de catégorie de pièce affectera l’effet contrôlable, et elle doit être coordonnée avec la conception de la tâche et les indicateurs.

Q : Le sous-ensemble synthétique convient-il aux ensembles d’entraînement directs master ?

R : L’usage le plus courant est de remplir la longue traîne et d’améliorer les données ; S’il est utilisé comme ensemble principal d’entraînement, il est recommandé de prêter attention au biais de distribution et de le mélanger avec le sous-ensemble réel pour les expériences témoins.

Analyse complète des ensembles de données open source HY3D-Bench : 252K ressources 3D prêtes à l’entraînement et évaluation unifiée Guide de téléchargement HY3D-Bench : Sous-ensembles complets/pièces/synthétiques et structure d’annuaires HY3D-bench vs ensembles de données 3D courants : nettoyage de qualité, décomposition des pièces et complétion à longue queue Qu’est-ce que les maillages étanches 252K : interprétation de sous-ensembles de niveau complet HY3D-Bench Comment utiliser des données de décomposition au niveau des parties de 240K : génération contrôlable au niveau des pièces HY3D-Bench À quoi servent les actifs synthétiques 3D 125K : stratégie de catégorie HY3D-Bench Synthetic Long-Tail Hunyuan3D-2.1-Reproduction de petite base : flux d’entraînement HY3D - Bench 0.8B Déchets de données pour la génération 3D : comment le HY3D-Bench nettoie les prêts à la formation Comment choisir un ensemble d’entraînement pour la génération d’actifs 3D : HY3D-Bench : trois types de combinaisons de données Pour quelles tâches HY3D-Bench convient-il : génération 3D, reconstruction, robotique et simulation HY3D-Bench Niveau complet : La valeur d’entraînement du rendu multi-vues et des points d’échantillonnage HY3D-Bench Niveau des pièces : idées d’évaluation pour l’étiquetage des pièces et le rendu d’assemblage HY3D-Bench Synthetic : pratique d’équilibrage de pipeline et de catégories de l’AIGC Comment télécharger des exemples de CLI de HY3D-Bench : Visage d’Étreintes par sous-ensemble Planification du volume de données et du stockage HY3D-Bench : comment se préparer à 11 To/5 To/6,5 To Utilisez HY3D-Bench pour créer une vue unique vers 3D : champs de données et points d’entraînement Montage contrôlé avec HY3D-Bench : supervision au niveau des composants et cohérence structurelle Prise robotique avec HY3D-Bench : décomposition des pièces et apprentissage de l’accessibilité financière Que signifie le format unifié de HY3D-Bench : Construire des pipelines de données réutilisables Comment réaliser des revues HY3D-Bench : recommandations de référence pour le modèle et les expériences témoins Qu’est-ce que le bruit de données 3D : le traitement étanche/normalisé de HY3D-Bench HY3D-Bench est-il adapté aux modèles de diffusion : entraînement de l’organisation des entrées et sorties HY3D-Bench est-il adapté à la configuration des tokens en 3D autorégressive vs. poids de base ? Où est le poids de base HY3D-Bench 0,8B : version des jetons 2048/4096 Reproduire la base HY3D-Bench à partir de zéro : environnement, données, scripts Comment la granularité des parties de HY3D-Bench affecte la contrôlabilité : notes pratiques Déviation des données synthétiques HY3D en laboratoire : comment faire des rapports d’ablation et de mélange HY3D-Bench Longue Queue 1 Sous-classe 252 : Conception et couverture de la catégorie Flux de travail de production de contenu 3D : ce que signifie HY3D-Bench pour la création de contenu numérique Données d’entraînement sur les actifs de jeu/TV : ce que HY3D-Bench peut offrir Intégration de la perception et de la génération 3D : positionnement écologique des données de HY3D-Bench Résumé FAQ HY3D-Bench : Téléchargement, formation, licences et limites d’utilisation Principes essentiels de la licence et de la conformité HY3D-Bench : comment lire les notes de distribution et de source HY3D - Pensée de laboratoire vs. ShapeNet/Objaverse : préparation à l’entraînement vs. différences structurées HY3D-Bench est-il adapté au benchmarking : standardisation des données et de la valeur du protocole ? Comment HY3D-Bench peut aider à évaluer la cohérence : l’importance d’unifier les données avec des bases de référence La valeur du laboratoire HY3D dans la reproduction de recherche : poids de base léger et poids public Le prétraitement des données HY3D-Bench permet d’éviter beaucoup de difficultés : nettoyage, normalisation et uniformité du format Que faire si le téléchargement complet de HY3D-Bench est trop volumineux : stratégie de mise en scène vs. pull à la demande Structure de répertoire HY3D-Bench en détail : dans quelle mesure la correspondance complète/partie/synthétique aux tâches Comment utiliser HY3D-Bench complète/formation/val/test : suggestions de division Training and Validation HY3D-Bench synthétique/glb vs. img : Comment les données de génération conditionnelle sont-elles appariées HY3D-Bench pièce/water_tight_meshes : Comment le maillage de la pièce est organisé Rendu multi-vue HY3D-Bench : Le rôle des bits standard de caméra dans l’entraînement Points échantillonnés HY3D-Bench : usage courant pour l’apprentissage et l’évaluation de la géométrie HY3D-Bench est destiné à la mise en œuvre industrielle : le point d’atterrissage des robots et de la production de contenu Liste de contrôle pour débuter HY3D-Bench : la puissance de calcul, le stockage et les outils dont vous avez besoin Limitations et risques du HY3D-Bench : volume, biais et cohérence des étiquettes

Outils Recommandés

Plus