同益千文は、多言語対応、リアルタイム、そして実装可能な機能を特徴とするQwen3Guardセキュリティレビューモデルシリーズを発表しました。119の言語と方言をサポートするこのシリーズは、3つのパラメータスケール(0.6B、4B、8B)と2つのフォームファクターを提供します。Qwen3Guard -Streamは、低遅延ストリーミング検出(リアルタイム会話、ライブブロードキャスト、オンラインアプリケーション向け)を、 Qwen3Guard-Genは、フルコンテキストのセキュリティ分析とポリシー解釈を特徴とし、強化学習報酬モデリングなどのオフライン評価シナリオに適しています。モデル出力は、安全/物議を醸す/安全でないの3段階リスク分類システムと、ポリシーの実装と監査を容易にする多次元カテゴリラベルを活用しています。
公式技術資料およびコミュニティページによると、このシリーズは英語、中国語、および多言語のセキュリティベンチマークにおいて、最高水準または同等のパフォーマンスを達成しています。Hugging FaceとModelScopeの重み付けおよび推論のサンプルに加え、技術レポートと使用ガイドもご用意しています。実際の効果は、導入時のレイテンシ、しきい値、およびシナリオのカスタマイズによって異なります。機密性が非常に高いシナリオやコンプライアンスが重要なシナリオでは、手動によるレビューとビジネスブラックリストへの登録が推奨されます。
よくある質問
Q: どのようなモデルや用途がありますか?
A: 0.6B/4B/8Bの3つの速度があります。Streamはリアルタイムの低遅延レビューに適しており、Genはフルコンテキスト判断とRL報酬モデリングに適しています。
Q: どの言語がサポートされていますか?
A: 119 の言語と方言をカバーし、言語間の堅牢性と、あいまいなテキストや話し言葉のバリエーションの処理を重視しています。
Q: 出力をどのように解釈すればよいですか?
A: リスク分類 (安全/議論の余地あり/安全でない) とカテゴリ ラベルが提供され、インターセプト、降格、または手動レビューにマッピングするために使用できます。
Q: オープンソースですか?
A: 設定と推論スクリプトを含むオープンソースの重みと推論の例を提供します。技術レポートにはデータとトレーニングの詳細が記載されています。
Q: 既存のシステムにどのように統合するのですか?
A: ウェアハウスの例に従って重みをロードし、しきい値とカテゴリ マッピングを設定します。ストリーミング シナリオには Qwen3Guard-Stream を使用し、オフライン/トレーニング シナリオには Gen を使用します。