MiniMax 开源 VTP:可扩展预训练让 Visual Tokenizer 直接提升 DiT 生成质量 一、摘要 VTP(Visual Tokenizer Pre-training)是 MiniMax(Hailuo)团队开源的视觉 tokenizer 预训练框架,面向扩散模型与 Diffusion Transformer(DiT)等下一代生成模型。项目指出传统“仅重建”的 tokenizer 训练会让... Ai开源 • Admin • 2025/12/19 81