Qwen宣布：Qwen3-VL已登陆llama.cpp，GGUF权重覆盖2B至235B

Qwen宣布：Qwen3-VL已登陆llama.cpp，GGUF权重覆盖2B至235B

AI资讯 • Admin • 2025/11/2 • 675 次浏览

Qwen官方宣布，视觉语言模型Qwen3-VL现已在llama.cpp获得原生支持，并同步发布全系GGUF权重，覆盖2B至235B等多种规格，可在CPU、CUDA、Metal、Vulkan等后端直接本地运行。配套下载入口已在Hugging Face与魔搭社区上线，便于按设备与精度选择量化版本。

llama.cpp的合并请求已在主仓合入，说明新增对Qwen3-VL（含Dense与MoE变体）的加载与推理支持；Qwen仓库与文档亦更新本地运行与GGUF使用指引。整体来看，本次更新实现“官方宣告＋权重发布＋推理框架支持”三件套落地，降低了多模态大模型在边缘与个人设备的部署门槛。

常见问题

Q：这次更新具体包含什么？

A：llama.cpp主干已合入Qwen3-VL支持；官方同时发布2B至235B等GGUF权重，并提供集合页便于下载与选择量化。

Q：能在哪些硬件上运行？

A：官方口径支持CPU、NVIDIA CUDA、Apple Metal、Vulkan等后端，适配常见桌面与笔记本环境。

Q：在哪里获取权重？

A：Hugging Face与ModelScope均提供Qwen3-VL集合与对应GGUF仓库。

Q：合并状态如何确认？

A：llama.cpp的PR已显示“Merged”，可在主仓查看变更与提交记录。

Q：是否包含运行指南？

A：Qwen文档与仓库提供llama.cpp本地运行与GGUF使用说明，涵盖模型获取与启动示例。

Qwen3-VL原生支持llama.cpp 官方发布Qwen3-VL全系GGUF权重 2B至235B多规格量化可选下载 CPUCUDAMetalVulkan本地直跑支持 Dense与MoE变体加载与推理兼容 llama.cpp主仓PR已合并Merged状态 HuggingFace与魔搭社区同步上线按设备与精度选择量化版本入口视觉语言多模态模型本地部署边缘与个人设备部署门槛降低 Qwen仓库更新GGUF使用指引文档包含本地运行与启动示例推理框架支持权重发布三件套桌面笔记本环境一键运行体验多平台后端适配覆盖广泛 WindowsmacOSLinux跨平台实践 NVIDIA显卡CUDA加速推理指南 AppleMetal后端Mac部署教程 Vulkan后端轻量设备运行方案 CPU直跑性能与显存需求评测选择Qwen3-VL量化精度的建议 GGUF权重下载镜像与校验方法本地多模态推理安全与隐私 Dense对比MoE性能与资源取舍适配摄像头图像输入调用示例 llama.cpp加载参数与命令范式 Qwen3-VL聊天与识图能力展示结合RAG与工具调用的配置本地部署常见错误与排查清单低显存设备运行的量化方案推理速度优化与线程设置技巧模型权重目录结构与命名规范社区评测基准与横向对比数据插件生态与前端UI集成思路多卡与大模型分片加载实验个人隐私数据离线处理优势开源许可与商用合规注意事项结合PythonAPI的调用样例多模态提示词工程最佳实践自动批处理与流式推理配置端侧AI应用场景落地参考模型更新与后续版本跟踪方式魔搭与HF集合页导航速达量化位宽对画面理解影响视频帧抽样与长图解析设定多语言OCR与字幕理解能力本地评测脚本与日志采集方法开箱即用的最小启动命令行结合GGUF与KV缓存的技巧新手上手Qwen3-VL速通手册

相关文章

24小时AI新闻：亚太治理新提案、产业落地与安全合规同频推进

24小时AI新闻：亚太治理新提案、产业落地与安全合规同频推进

在过去24小时内（11月1日—11月2日），亚太层面围绕人工智能全球治理出现新动向；中国在产业应用与城市数字化政策上多点开花；北美媒体与机构聚焦AI在执法与心理健康场景的风险与合规。整体呈现“中国应用...

Descript AI视频与播客编辑器，文本驱动剪辑助力内容创作者高效出片

Descript AI视频与播客编辑器，文本驱动剪辑助力内容创作者高效出片

一、基本信息 Descript 是一款面向视频与音频创作的 AI 编辑软件，突出文本驱动的剪辑方式与多项智能处理能力。产品将录制、转写、剪辑、设计、生成与发布统一在同一工作区，并提供多语言转写、AI ...

Kimi K3正式上线：2.8万亿参数押注百万上下文与开放权重

Kimi K3正式上线：2.8万亿参数押注百万上下文与开放权重

月之暗面（Moonshot AI）正式推出 Kimi K3 。这款2.8万亿参数模型提供100万 token 上下文和原生多模态能力，已登陆 Kimi.com、Kimi Work、Kimi Code ...

Mistral Studio 新增提示词版本管理：企业 AI 开始管行为资产

Mistral Studio 新增提示词版本管理：企业 AI 开始管行为资产

2026 年 7 月 9 日，Mistral 在官方文章《Your Prompts and Skills need a system of record》中宣布，Studio 开始为 Prompts ...

推荐工具