Qwen3-Next-80B-A3B wird eingeführt: 3B-aktiviertes Ultra-Sparse-MoE, ein neuer Maßstab für Long-Context-Durchsatz
Qwen3-Next-80B-A3B konzentriert sich auf 80 Mrd. Gesamtparameter, nur 3 Mrd. Aktivierung pro Token, verwendet eine Hybrid-Architektur (Gated DeltaNet ...