戻るAI情報
Qwen、Qwen3-VL-30B-A3B Instruct/Thinking: 3B アクティベーションパラメータ、FP8 をサポートする新しいマルチモーダルコンビネーションをリリース

Qwen、Qwen3-VL-30B-A3B Instruct/Thinking: 3B アクティベーションパラメータ、FP8 をサポートする新しいマルチモーダルコンビネーションをリリース

AI情報 Admin 209 回閲覧

2025年10月4日、Qwenはコードベースに2つの新しいマルチモーダルモデル、Qwen3-VL-30B-A3B-Instructと-Thinkingのリリースを正式に発表し、同時にFP8量子化バージョンを提供しました。これより前に、より大規模なQwen3-VL-235B-A22Bが9月にリリースされ、FP8バリアントの提供を開始しました。30B-A3BはMixture-of-Expertsアーキテクチャを採用し、1回の推論あたり約30億の活性化パラメータを備えています。Qwen3-VLの機能を維持しながら、スループットと展開効率を大幅に向上させることが目標です。公式チャンネルでは、STEM、VQA、OCR、ビデオ理解、エージェントなどのタスクにおいてGPT-5-MiniやClaude 4 Sonnetと競合でき、いくつかのベンチマークで「しばしばリードしている」と主張していますが、独立した評価はまだ保留中です。

Qwen Chatは現在、オプションのモデルアクセスを提供しており、HuggingFaceとModelScopeは関連する加重バージョンと量子化バージョンをリリースしています。APIページにはモデルシリーズも掲載されています。リリース記事とリポジトリログは公式情報であり、一部のパフォーマンス比較はベンダーによる自己報告であることにご注意ください。サードパーティによるレプリケーション実験がなければ、「同等/上回る」という結論は確定的なものではありません。コストとデプロイメントを重視するチームにとって、FP8バージョンはメモリと帯域幅の使用量を削減し、スループットを向上させることを目的としていますが、具体的なメリットはハードウェアと推論スタックによって異なります。本番環境に移行する前に、対象データセットと推論シナリオでA/Bテストを実施することをお勧めします。

よくある質問

Q: Qwen3-VL-30B-A3B はいつリリースされますか?

A: 公式リポジトリのニュースによると、発売日は2025年10月4日です。関連ブログやモデルカードは当日以降徐々に更新されます。

Q: いわゆる「3B アクティベーション パラメータ」とはどういう意味ですか?

A: これはMoE(Mixture of Experts)アーキテクチャの特徴です。完全なモデルには約300億個のパラメータがありますが、各フォワードパスでアクティブ化されるのは約30億個のみであるため、コスト効率とスループットの向上に役立ちます。

Q: FP8 バージョンの用途は何ですか?

A: FP8量子化は推論効率とリソース使用率を最適化します。原理的には、ビデオメモリと帯域幅の要件を削減し、スループットを向上させることができます。メリットはハードウェアと実装によって異なります。

Q: GPT-5-Mini と Claude 4 Sonnet との比較は信頼できるものですか?

A:これはメーカー自身の声明であり、第三者による再現実験や公開ベンチマークの詳細が不十分です。宣伝と捉えるべきです。独立した評価を待つことをお勧めします。

Q: ウェイトを体験したり入手したりできる場所はどこですか?

A: Qwen Chatはオンライントライアルを提供しており、HuggingFaceとModelScopeにはモデル版と量子化版があります。企業はAlibaba Cloud Model StudioのAPIを通じてこれらのモデルシリーズにアクセスできます。

Qwen3-VL-30B-A3B リリース Qwen3-VL-30B-A3B-指示 Qwen3-VL-30B-A3B-思考 Qwen3-VL 新モデル 2025年10月4日発売 Qwen3-VL-235B-A22B FP8量子化バージョン FP8推論最適化 3B活性化パラメータ MoEアーキテクチャの解釈 マルチモーダル大規模モデル STEMタスク評価 VQAパフォーマンス OCR認識機能 ビデオ理解モデル エージェントアプリケーション スループットの向上 展開効率の最適化 ビデオメモリ使用量の削減 帯域幅要件の削減 推論スループットの比較 Readme ベンチマークアラート 第三者による評価が保留中 ベンチマーク再現 A/Bテストの提案 ハードウェア依存の影響 推論スタックの選択 コストとパフォーマンスのトレードオフ エンタープライズ展開ガイド モデルカードの更新 倉庫アナウンスの解釈 QwenChat体験入場 ハギングフェイスウェイト ModelScope モデル Alibaba Cloud モデルスタジオ API オープンソースモデルのダウンロード GPT-5-Miniとの比較 Claude4Sonnetとの比較 幅広い機能カバレッジ 本番環境の切り替え オンラインAPI呼び出し ローカル推論の展開 FP8 ベネフィット評価 マルチモーダル推論の練習 モデル選択戦略 訓練と推論の違い エコシステムツールのサポート バージョン反復追跡 リスクとコンプライアンスのヒント 開発者向けの通訳

関連記事

24時間AIニュース:新たなエッジAI製品と投資・資金調達への期待の高まりが香港株式市場のAIセクター上昇を牽引

24時間AIニュース:新たなエッジAI製品と投資・資金調達への期待の高まりが香港株式市場のAIセクター上昇を牽引

過去24時間、海外ではエッジAIプラットフォームの発表、ウォール街のAI設備投資に関する最新の期待とリスク評価、文化産業における生成コンテンツをめぐる倫理的議論などが報じられ、国内では香港株と中国のA...

24時間AIニュース:Tongyi Qianwenが新しいマルチモーダル技術をオープンソース化し、Soraが著作権保護を導入。

24時間AIニュース:Tongyi Qianwenが新しいマルチモーダル技術をオープンソース化し、Soraが著作権保護を導入。

過去24時間で、国内ではモデルのオープンソース化と産業実装、AIガバナンスと法の支配の問題が同時に進展し、海外ではOpenAI Soraが著作権とコンテンツのセキュリティの二重の焦点を引き起こし、NV...

MWC上海がロボットのペナルティシュートアウトを開催:具現化された知能が公衆試験会場に移動する

MWC上海がロボットのペナルティシュートアウトを開催:具現化された知能が公衆試験会場に移動する

2026年6月1日、IT HomeはGSMAが本日、2026年6月24日から25日まで上海MWCでテーマイベントとして「ヒューマノイドロボットペナルティシュートアウト」を開催することを正式に発表したと...

CodexがWindows制御をサポートする:AIプログラミングエージェントがクロスプラットフォームコラボレーションを開始

CodexがWindows制御をサポートする:AIプログラミングエージェントがクロスプラットフォームコラボレーションを開始

2026年6月1日時点でも、OpenAIヘルプセンターのChatGPTリリースノートは最新の更新として表示されています。5月29日のエントリーには次のように記載されています:Codexは現在、Code...

おすすめツール

もっと見る