Tongyi Qianwen a lancé la série de modèles d'analyse de sécurité Qwen3Guard, offrant des fonctionnalités multilingues, temps réel et implémentables. Prenant en charge 119 langues et dialectes, la série propose trois échelles de paramètres (0,6B, 4B et 8B) et deux formats : Qwen3Guard-Stream pour la détection de flux à faible latence (pour les conversations en temps réel, les diffusions en direct et les applications en ligne) ; et Qwen3Guard-Gen pour l'analyse de sécurité en contexte complet et l'interprétation des politiques, adaptée aux scénarios d'évaluation hors ligne tels que la modélisation des récompenses par apprentissage par renforcement. Les résultats du modèle utilisent un système de classification des risques à trois niveaux : Sûr/Controversé/Dangereux , ainsi que des étiquettes de catégories multidimensionnelles pour faciliter la mise en œuvre et l'audit des politiques.
Les documents techniques officiels et les pages communautaires indiquent que cette série atteint des performances de premier plan ou comparables lors des tests de sécurité en anglais, en chinois et dans plusieurs langues. Des exemples de pondération et d'inférence Hugging Face et ModelScope sont disponibles, ainsi qu'un rapport technique et un guide d'utilisation. L'efficacité réelle dépend de la latence de déploiement, des seuils et de la personnalisation des scénarios. Pour les scénarios hautement sensibles ou critiques en matière de conformité, une vérification manuelle et une liste noire d'entreprise restent recommandées.
Questions fréquemment posées
Q : Quels sont les modèles et les utilisations ?
R : Il existe trois vitesses : 0,6 B/4 B/8 B. Stream est adapté à l'analyse en temps réel à faible latence, tandis que Gen est adapté à l'évaluation contextuelle complète et à la modélisation des récompenses RL.
Q : Quelles langues sont prises en charge ?
A : Couvrant 119 langues et dialectes, mettant l'accent sur la robustesse interlinguistique et la gestion des variations ambiguës du texte et de la langue parlée.
Q : Comment interpréter le résultat ?
R : Il fournit une classification des risques (sûr/controversé/dangereux) et des étiquettes de catégorie, qui peuvent être utilisées pour établir une correspondance avec une interception, une rétrogradation ou un examen manuel.
Q : Est-ce open source ?
R : Nous fournissons des exemples de pondération et d'inférence open source, y compris des scripts de configuration et d'inférence ; le rapport technique détaille les données et les détails de la formation.
Q : Comment s'intégrer dans les systèmes existants ?
A : Chargez les poids en fonction des exemples d'entrepôt, définissez les seuils et les mappages de catégories ; utilisez Qwen3Guard-Stream pour les scénarios de streaming et Gen pour les scénarios hors ligne/de formation.