L’équipe Qwen a lancé la série de modèles moyens Qwen3.5, incluant Qwen3.5-35B-A3B, Qwen3.5-122B-A10B, Qwen3.5-27B, et a fourni une version Qwen3.5-Flash pour la production en ligne. Selon les informations officielles, Flash est aligné sur les capacités 35B-A3B, mettant l’accent sur l’amélioration des performances d’intelligence globale à des coûts de calcul plus faibles et la réduction de l’écart avec des modèles plus grands dans des scénarios d’utilisation d’agents plus complexes.
Cette série de modèles a été listée dans les collections Hugging Face et ModelScope ; Côté API cloud, Alibaba Cloud Model Studio propose des interfaces et des listes de modèles liées à Qwen, tandis que Flash se concentre sur la fenêtre contextuelle par défaut de 1M et les fonctionnalités officielles intégrées de l’outil. Les utilisateurs doivent toujours prêter attention aux changements de coût et de latence engendrés par les contextes longs, les permissions d’appel d’outil et la conformité des données, ainsi qu’aux différences dans l’utilisation de la mémoire et la configuration des paramètres d’inférence lors du déploiement sur site.
FAQ
Q : Quel est le positionnement de la version Qwen 3.5-Flash ?
R : Qwen 3.5-Flash est une version destinée à la production et à l’hébergement en ligne, officiellement considérée comme compatible avec la capacité 35B-A3B et offrant un contexte plus long ainsi que des outils intégrés.
Q : Où puis-je trouver Qwen3.5-35B-A3B, 27B, 122B-A10B ?
R : Les modèles concernés ont été publiés sous forme de collections dans Hugging Face et ModelScope, qui peuvent être téléchargées et utilisées selon les instructions de la carte de modèles.
Q : Le contexte par défaut 1M de Qwen 3.5-Flash est-il adapté à toutes les tâches ?
R : Les contextes longs conviennent mieux aux documents volumineux, au code long et aux tâches d’agents multi-tours, mais ils peuvent entraîner des coûts plus élevés et des temps de réponse plus longs.
Q : La série Qwen3.5 prend-elle en charge les appels d’outils et les appels de fonctions ?
R : La description officielle de l’interface cloud offre des capacités intégrées liées aux outils ; Les outils spécifiques et les autorisations disponibles sont soumis à la documentation de la plateforme et à la configuration de la console.