통이첸웬(Tongyi Qianwen)은 교차 언어, 실시간 및 구현 가능한 기능을 갖춘 Qwen3Guard 보안 검토 모델 시리즈를 출시했습니다. 119개 언어와 방언을 지원하는 이 시리즈는 세 가지 매개변수 척도(0.6B, 4B, 8B)와 두 가지 폼 팩터를 제공합니다. 실시간 대화, 라이브 방송 및 온라인 애플리케이션용 저지연 스트리밍 탐지를 위한 Qwen3Guard-Stream 과 강화 학습 보상 모델링과 같은 오프라인 평가 시나리오에 적합한 전체 컨텍스트 보안 분석 및 정책 해석을 위한 Qwen3Guard-Gen 이 있습니다. 모델 출력은 안전/논란/불안전의 3단계 위험 분류 시스템과 다차원 범주 레이블을 활용하여 정책 구현 및 감사를 용이하게 합니다.
공식 기술 자료와 커뮤니티 페이지에 따르면 이 시리즈는 영어, 중국어 및 다국어 보안 벤치마크에서 최고 수준 또는 그에 준하는 성능을 달성합니다. Hugging Face 및 ModelScope 가중치 및 추론 예제와 함께 기술 보고서 및 사용 가이드를 제공합니다. 실제 효과는 배포 지연 시간, 임계값 및 시나리오 사용자 지정에 따라 달라집니다. 매우 민감하거나 규정 준수가 중요한 시나리오의 경우, 수동 검토 및 비즈니스 블랙리스트 작성이 여전히 권장됩니다.
자주 묻는 질문
질문: 어떤 모델과 용도가 있나요?
A: 속도는 0.6B/4B/8B의 세 가지입니다. Stream은 실시간 저지연 검토에 적합하고, Gen은 전체 맥락 판단 및 강화 학습 보상 모델링에 적합합니다.
질문: 어떤 언어가 지원되나요?
A: 119개 언어와 방언을 포괄하며, 언어 간 견고성과 모호한 텍스트 및 구어체 변형 처리에 중점을 둡니다.
질문: 출력을 어떻게 해석하나요?
답변: 위험 분류(안전/논란의 여지가 있음/안전하지 않음)와 범주 레이블을 제공하며, 이를 사용하여 차단, 강등 또는 수동 검토에 매핑할 수 있습니다.
질문: 오픈소스인가요?
답변: 우리는 구성 및 추론 스크립트를 포함하여 오픈 소스 가중치와 추론 예제를 제공합니다. 기술 보고서에는 데이터와 학습 세부 정보가 자세히 나와 있습니다.
질문: 기존 시스템에 어떻게 통합할 수 있나요?
답변: 창고 사례에 따라 가중치를 설정하고 임계값과 카테고리 매핑을 설정합니다. 스트리밍 시나리오에는 Qwen3Guard-Stream을 사용하고 오프라인/훈련 시나리오에는 Gen을 사용합니다.