Retour à Informations sur l’IA
Qwen3-Max-Instruct/Thinking est désormais disponible : les capacités de codage et d'agent sont considérablement améliorées

Qwen3-Max-Instruct/Thinking est désormais disponible : les capacités de codage et d'agent sont considérablement améliorées

Informations sur l’IA Admin 98 vues

Qwen a annoncé le lancement de son modèle phare de nouvelle génération, Qwen3-Max , officiellement décrit comme « sans préversion, prêt à l'emploi ». Ce modèle est disponible en deux formats : Instruct et Thinking . Le premier est axé sur l'implémentation générale et les applications d'ingénierie, tandis que le second optimise l'utilisation des outils et le raisonnement complexe. D'après les documents de publication, Qwen3-Max-Instruct se compare avantageusement aux modèles leaders sur plusieurs benchmarks, notamment SWE-Bench, Tau2-Bench, SuperGPQA, LiveCodeBench et AIME25 . Qwen3-Max-Thinking, utilisé en mode « lourd » et combiné à l'invocation d'outils, promet des performances quasi parfaites sur les benchmarks clés.

Alibaba Cloud Model Studio a lancé CODE INLINE 0 et des versions snapshot, offrant un contexte étendu, une facturation à plusieurs niveaux et la prise en charge de la mise en cache contextuelle. Le blog officiel indique que cette série s'appuie sur l'expansion continue des données volumineuses, du pré-entraînement et de l'apprentissage par renforcement (RL), ciblant le codage, les workflows d'agents et les scénarios de documents longs. Les performances réelles, les tarifs et les quotas dépendent de la page du modèle et de la console.

Questions fréquemment posées

Q : Où puis-je l'expérimenter et l'invoquer ?

R : Qwen Chat offre une expérience en ligne ; Alibaba Cloud Model Studio ouvre l'API qwen3-max et les instantanés.

Q : Quelle est la différence entre Instruire et Penser ?

A : Instruct est destiné à une utilisation générale et à la mise en œuvre technique ; Thinking combine l'utilisation d'outils et le mode « lourd », en se concentrant sur le raisonnement profond.

Q : Quels sont les indicateurs publics ?

R : Les résultats officiels sont présentés comme étant de premier ordre/de référence sur des benchmarks tels que SWE-Bench, Tau2-Bench, SuperGPQA, LiveCodeBench et AIME25 . Veuillez consulter le blog et la page du modèle pour plus de détails.

Q : Quel est le rapport entre le contexte et la facturation ?

R : La page Model Studio affiche 256 000 contextes de niveau avec une tarification à plusieurs niveaux et prend en charge la mise en cache de contexte et les versions instantanées.

Q : Le poids est-il open source ?

R : Il s'agit d'une version de produit disponible en ligne. La disponibilité en open source sera annoncée ultérieurement.

Qwen3-Max sorti Modèle phare Qwen3-Max Qwen3-MaxInstruct Qwen3-MaxThinking Qwen3-Mode Maxheavy Appel d'outil Qwen3-Max Raisonnement complexe Qwen3-Max Lancement du projet Qwen3-Max Capacités d'encodage Qwen3-Max Banc Qwen3-MaxSWE Banc Qwen3-MaxTau2 Qwen3-MaxSuperGPQA Qwen3-MaxLiveCodeBench Qwen3-MaxAIME25 Les meilleurs benchmarks de Qwen3-Max Qwen3-Max peut être utilisé directement sans aperçu Contexte long Qwen3-Max 256K Cache de contexte Qwen3-Max Version instantanée de Qwen3-Max Qwen3-Max Facturation à plusieurs niveaux Qwen3-MaxModelStudio Expérience Qwen3-MaxQwenChat Appel d'API Qwen3-Max Flux de travail de l'agent Qwen3-Max Scénario de document long Qwen3-Max Qwen3-Max Chaîne de pensées Qwen3-Max Apprentissage par renforcement RL Pré-entraînement à grande échelle Qwen3-Max Collaboration de l'outil Qwen3-Max Examen du code Qwen3-Max Réparation en plusieurs étapes Qwen3-Max Mission terminale Qwen3-Max Fenêtre contextuelle de Qwen3-Max Quota de prix Qwen3-Max Informations sur la page du modèle Qwen3-Max Console Qwen3-Max activée Scores de référence Qwen3-Max Lancement de Qwen3-Max Enterprise Guide du développeur Qwen3-Max Meilleures pratiques Qwen3-Max Qwen3-Max et Qwen3-VL fonctionnent ensemble Qwen3-Max contre GPT-5 Qwen3-MaxHeavy score presque complet Intégration de la chaîne d'outils Qwen3-Max Code proxy Qwen3-Max Qwen3-Max stabilité des sessions longues Économies de cache de contexte Qwen3-Max Coordination multimodale Qwen3-Max Mise à niveau du modèle Qwen3-Max FAQ sur Qwen3-Max

Outils Recommandés

Plus