Qwen の発表: Qwen3-VL が llama.cpp で利用できるようになりました。GGUF の重みは 2B から 235B の範囲です。

AI情報 • Admin • 2025/11/2 • 675 回閲覧

Qwenは、ビジュアル言語モデルQwen3-VLがllama.cppでネイティブサポートされ、2Bから235Bまでの様々な仕様をカバーするGGUFの重みがフルレンジでリリースされたことを正式に発表しました。CPU、CUDA、Metal、Vulkanなどのバックエンドで直接実行できます。ダウンロードリンクはHugging FaceとModaコミュニティで公開されており、ユーザーはデバイスと精度に応じて量子化バージョンを選択できます。

llama.cpp のマージリクエストがメインリポジトリに統合され、Qwen3-VL（Dense および MoE バリアントを含む）のロードと推論のサポートが追加されました。また、Qwen リポジトリとドキュメントも更新され、ローカル実行と GGUF の使用ガイドラインが追加されました。全体として、このアップデートにより、「公式発表 + 重みのリリース + 推論フレームワークのサポート」という 3 点セットが実現され、エッジデバイスや個人用デバイスにおけるマルチモーダル大規模モデルの導入ハードルが下がります。

よくある質問

Q: このアップデートには具体的に何が含まれていますか?

A: llama.cpp トランクは Qwen3-VL サポートに統合されました。公式 Web サイトでも 2B から 235B までの GGUF 重みがリリースされ、簡単にダウンロードして定量化を選択できるコレクションページが提供されています。

Q: どのハードウェアで実行できますか?

A: 公式発表によると、CPU、NVIDIA CUDA、Apple Metal、Vulkan などのバックエンドをサポートしており、一般的なデスクトップおよびラップトップ環境と互換性があります。

Q: 重量はどこで入手できますか?

A: Hugging Face と ModelScope はどちらも、Qwen3-VL コレクションと対応する GGUF リポジトリを提供しています。

Q: マージステータスはどのように確認されますか?

A: llama.cpp の PR は「マージ済み」としてマークされています。変更履歴とコミット履歴はメインリポジトリでご確認いただけます。

Q: ランニングガイドは含まれていますか?

A: Qwen のドキュメントとリポジトリには、モデルの取得と起動の例を含む、llama.cpp をローカルで実行し、GGUF を使用する手順が記載されています。

Qwen の発表: Qwen3-VL が llama.cpp で利用できるようになりました。GGUF の重みは 2B から 235B の範囲です。

関連記事

24時間AIニュース：アジア太平洋地域の新たなガバナンス提案、産業実装、セキュリティコンプライアンスが同時に進展

Descript AI ビデオおよびポッドキャストエディター。テキスト主導の編集により、コンテンツ作成者はビデオを効率的に制作できます。

Kimi K3公式発表:2.8兆のパラメータが数百万のコンテキストとオープンウェイトに賭けられます

Mistral Studioがプロンプトバージョン管理を追加:エンタープライズAIが行動資産を管理しています

おすすめツール

Qwen の発表: Qwen3-VL が llama.cpp で利用できるようになりました。GGUF の重みは 2B から 235B の範囲です。

関連記事

24時間AIニュース：アジア太平洋地域の新たなガバナンス提案、産業実装、セキュリティコンプライアンスが同時に進展

Descript AI ビデオおよびポッドキャスト エディター。テキスト主導の編集により、コンテンツ作成者はビデオを効率的に制作できます。

Kimi K3公式発表:2.8兆のパラメータが数百万のコンテキストとオープンウェイトに賭けられます

Mistral Studioがプロンプトバージョン管理を追加:エンタープライズAIが行動資産を管理しています

おすすめツール

AIツールを投稿

投稿情報を確認してください

Descript AI ビデオおよびポッドキャストエディター。テキスト主導の編集により、コンテンツ作成者はビデオを効率的に制作できます。