返回AI资讯
阿里通义发布 Qwen3-VL-4B 与 8B 模型,多模态版本正式上线

阿里通义发布 Qwen3-VL-4B 与 8B 模型,多模态版本正式上线

AI资讯 Admin 114 次浏览

阿里云通义千问团队宣布 Qwen3-VL 系列模型新增两款开源版本——Qwen3-VL-4B 与 Qwen3-VL-8B,现已在 GitHub 平台上线。官方介绍,这两款模型延续 Qwen3 架构,并针对图文多模态任务进行优化,能够理解图像、文本及表格内容,支持生成式回答与复杂视觉推理。

从技术文档看,Qwen3-VL-4B 面向轻量级应用,兼顾性能与部署成本;Qwen3-VL-8B 则提供更高精度与更强视觉理解能力,适用于科研及企业级任务。官方表示,社区用户可自由测试模型性能并反馈结果,无论成功或失败案例都被鼓励公开分享。此次发布被视为通义在开源多模态方向的重要扩展。

常见问题

Q:Qwen3-VL 是什么类型的模型?

A:它是通义千问的多模态模型,能同时处理图像与文本输入。

Q:本次发布包含哪些新版本?

A:新增 Qwen3-VL-4B 与 Qwen3-VL-8B 两个参数规模的开源模型。

Q:这些模型在哪个平台获取?

A:模型代码与权重文件已发布在 Qwen 官方 GitHub 仓库。

Q:与之前版本相比有何改进?

A:主要提升视觉理解、OCR 准确度及跨模态推理能力,并优化了推理速度。

Q:是否可商用或本地部署?

A:依照 Qwen 官方开源许可协议,可在符合条款的前提下自由研究与部署。

推荐工具

更多