돌아가기 AI 정보
Qwen 3. 5 - Omni 출시 : 긴 음성 비디오 이해에서 실시간 음성 비디오 상호 작용으로

Qwen 3. 5 - Omni 출시 : 긴 음성 비디오 이해에서 실시간 음성 비디오 상호 작용으로

AI 정보 Admin 103 회 조회

Q wen 3. 5 - Om ni 가 Q wen 에 의해 공식적으로 출시 되었습니다 . Q wen Chat 의 경험 포 털 은 Voice Chat 및 Video Chat 을 가리 켰 습니다 .그것은 검색 및 조정 도구를 한 라 운드 상호 작용 으로 압 력을 가 하지만 구체적인 모델 과 개방 범 위를 확인 해야합니다 .

오 프 라인 에서는 타임 스 탬 프 , 샷 전환 및 연 사 매 핑 이 있는 비디오 스크 립 트를 생성 하는 스크 립 트 수준의 캡 션 이 있으며 라이 브 에서는 미 세 한 음성 제어 , 웹 검색 및 복잡한 함 수 호출 을 동일한 상호 작용 세 트에 배치 합니다 .

외부 자료 는 최대 10 시간의 오 디오 , 400 초 의 720 p 비디오 , 113 개의 음성 인식 언어 또는 방 언 , 36 개의 음성 생성 언어 또는 방 언 을 포함한 몇 가지 하드 지 표를 제공 하며 Plus , Flash , Light 세 가지 그룹 으로 가족을 분 할 합니다 .

웹 페이지 가 실시간 음성 또는 비디오를 직접 열 수 있고 콘 솔 이 해당 모델을 호출 할 수 있다면 기본적으로 이러한 기능 이 사용할 수 있음을 의미합니다 .

공식 홍 보 는 Q wen 3. 5 - Om ni 구 경 의 가족을 사용 하지만 공개 API 문 서는 현재 Q wen - Om ni 와 Q wen 3 - Om ni - Flash , Real time 시리즈 , 음성 복 제 도 점차 적으로 엔지니어 링 방 출 에 있음을 주목 해야합니다 .

추천 도구

더보기