Back to Articles

vLLM vLLM a publié la version 0.17.1 et corrigé les correctifs clés pour le backend d’inférence, permettant d’implémenter centralisément des correctifs tels que TRTLLM MoE, le cache Mamba/Qwen3.5 et le traitement MTP

Found 1 related articles

Outils Recommandés

Plus