Qwenは、次世代フラッグシップモデルであるQwen3-Maxの発売を発表しました。公式には「プレビューなし、すぐに使用可能」と説明されています。このモデルには、 InstructとThinkingの2つの形式があります。前者は汎用実装とエンジニアリングアプリケーションに焦点を当て、後者はツールの使用と複雑な推論を強化します。リリース資料によると、Qwen3-Max-Instructは、SWE-Bench、Tau2-Bench、SuperGPQA、LiveCodeBench、AIME25など、複数のベンチマークにおいて主要モデルに匹敵する性能を発揮しています。Qwen3 -Max-Thinkingは、 「ヘビー」モードで使用し、ツール呼び出しと組み合わせることで、主要なベンチマークでほぼ完璧なパフォーマンスを実現すると主張しています。
Alibaba Cloud Model Studioは、CODE INLINE 0およびスナップショット版をリリースしました。大規模なコンテキスト、段階的な課金、コンテキストキャッシュのサポートを提供します。公式ブログによると、このシリーズは、大規模データ、事前トレーニング、強化学習(RL)の継続的な拡張を基盤としており、コーディング、エージェントワークフロー、長文ドキュメントのシナリオを対象としています。実際のパフォーマンス、価格、クォータは、モデルページおよびコンソールでご確認ください。
よくある質問
Q: どこで体験・通話できますか?
A: Qwen Chat はオンライン エクスペリエンスを提供します。Alibaba Cloud Model Studio は qwen3-max API とスナップショットを開きます。
Q: 「指導」と「考える」の違いは何ですか?
A: Instruct は一般的な使用とエンジニアリングの実装を目的としています。Thinking はツールの使用と「ヘビー」モードを組み合わせ、深い推論に重点を置いています。
Q: 公開指標とは何ですか?
A: 公式の結果は、SWE-Bench、Tau2-Bench、SuperGPQA、LiveCodeBench、AIME25などのベンチマークにおいて、トップ/ベンチマークとして掲載されています。詳細はブログとモデルページをご覧ください。
Q: コンテキストは請求とどのように関係しますか?
A: Model Studio ページには、階層化された価格設定の 256K レベルのコンテキストが表示され、コンテキスト キャッシュとスナップショット バージョンがサポートされます。
Q: 重量はオープンソースですか?
A: これは製品リリースであり、オンラインで入手可能です。オープンソース化されるかどうかは、後日発表いたします。