Youtu-VL-4B-Instruct 开源解读:用 VLUAS 让 4B 视觉感知“像模型原生能力” 一、摘要 Youtu-VL-4B-Instruct 是腾讯优图开源的紧凑型视觉语言模型(4B 参数),核心提出 VLUAS(Vision-Language Unified Autoregressive Supervision),将“视觉从输入变为可预测目标”,以统一自回归监督保留细粒度视觉信息。其目... Ai开源 • Admin • 2026/1/31 80