Lancement de Qwen3-Next-80B-A3B : un MoE ultra-clairsemé activé par 3B, une nouvelle référence pour le débit à contexte long
Qwen3-Next-80B-A3B se concentre sur 80B de paramètres totaux, seulement 3B d’activation par token, adopte une architecture hybride (Gated DeltaNet + G...