戻るAI情報
Wan 2.5 プレビュー強化されたオーディオとビデオの同期: 最大 10 秒のビデオと強化された画質が利用できるようになりました

Wan 2.5 プレビュー強化されたオーディオとビデオの同期: 最大 10 秒のビデオと強化された画質が利用できるようになりました

AI情報 Admin 30 回閲覧

Wan 2.5では、プレビュー版に「ネイティブオーディオ駆動型ビデオ生成」機能が追加されました。ユーザーは、テキストプロンプトや参照画像と組み合わせて、音声を制御信号として直接提供することで、テキストからビデオ、または画像からビデオを生成するタスクを実行できます。公式説明ではオーディオとビデオの同期機能が強調されており、プレビューフェーズでは1080p、24fpsの出力仕様が採用されています。ビデオの最大長は、選択したモデルとインターフェースパラメータに応じて5秒または10秒です。このアップデートは、ナレーション、音楽、または環境音によってショットのリズムと物語の方向性を決定できるようにすることで、より一貫性のある短編映画の生成を実現することを目指しています。

Alibaba Cloud Bailianとその製品ウェブサイトでは、Wan 2.5の「Video with Sound」プレビューは自動ダビングやカスタムオーディオファイル入力に対応しており、広告、eコマースのデモ、クリエイティブな短編映画などのシナリオに適しているとされています。プレビュー段階であるため、機能と可用性はプラットフォームや地域を段階的に拡大していく可能性があり、具体的なパフォーマンスは映像と下流のプロセスと連動して検証する必要があります。また、サードパーティの評価によると、ポートレートやモーションの安定性においてパフォーマンスにまだばらつきがあるため、プロジェクトごとに小規模なサンプルテスト映像での評価が推奨されています。

よくある質問

Q: オーディオは生成にどのように関係していますか?

A: 音声を駆動信号としてアップロードし、それをテキストプロンプトや参照画像と組み合わせて、ショットのリズム、感情、リップシンクをガイドすることができます。

Q: どのような長さと仕様がサポートされていますか?

A: プレビュー インターフェイスには、5 秒と 10 秒の 2 つの設定があり、24fps に固定され、最大 1080p で、MP4 (H.264) にエクスポートできます。

Q: どの入口が利用可能ですか?

A: Tongyi Wanxiang/Wan 製品ページと Alibaba Cloud Bailian API には、オーディオ機能とパラメータの説明が付いたプレビュー モデルがリストされています。

Q: 安定性はどうですか?

A: 公式デモではオーディオとビデオの同期が可能であることが示されていますが、サードパーティの評価では、ポートレートとモーションの一貫性はまだ変動しており、シーンに応じてテストする必要があると言われています。

Q: 商用および地域的な可用性はどうですか?

A: これはプレビュー機能です。有効化の範囲と条件は各プラットフォームのプラットフォームページとアカウント権限によって異なり、地域によって段階的に拡大される可能性があります。

Wan2.5ネイティブオーディオドライバー Wan2.5オーディオビデオプレビュー Wan2.5オーディオとビデオの同期 Wan2.5 テキストからビデオへ Wan2.5 画像からビデオへ Wan2.5 参照画像コントロール Wan2.5ナレーションドライバー Wan2.5 音楽ドライバー Wan2.5 アンビエントサウンドドライバー Wan2.5 リップシンク Wan2.5レンズリズムコントロール Wan2.5 物語の一貫性 Wan2.5 1080p出力 Wan2.524fps固定フレームレート ワン2.55秒仕様 Wan2.510秒仕様 Wan2.5MP4_H264エクスポート Wan2.5自動ダビング Wan2.5カスタムオーディオ Wan2.5 Alibaba Cloud Bailian API Wan2.5 同義万祥入口 Wan2.5広告ビデオ生成 Wan2.5 eコマースデモビデオ Wan2.5クリエイティブショートフィルム Wan 2.5 プレビュー機能 Wan2.5は徐々に音量が増加 Wan2.5の安定性評価 Wan2.5 ポートレートの一貫性 Wan2.5 モーション安定性 Wan2.5小型サンプル試験片 Wan2.5のパラメータとインターフェース Wan2.5 モデル選択 Wan2.5 の継続時間制限 Wan2.5フレームレート仕様 Wan2.5高解像度出力 Wan2.5 プロンプト単語の組み合わせ Wan2.5 参考画像ガイド Wan2.5サウンド制御信号 Wan2.5ビデオ生成制御 Wan2.5口頭放送の調整 Wan2.5音楽リズムドライバー Wan2.5 アンビエントサウンドナラティブ Wan2.5プレビューオープンレンジ Wan2.5エンタープライズ統合 Wan2.5 API呼び出しの例 Wan2.5制御強度調整 Wan2.5シナリオのベストプラクティス Wan2.5 商用利用および利用規約 Wan2.5プロジェクト評価 Wan2.5 よくある質問

関連記事

24時間AIニュース:AICCが「北京計画」を発表、Vibesはホワイトハウスの研究開発優先事項に沿って発売

24時間AIニュース:AICCが「北京計画」を発表、Vibesはホワイトハウスの研究開発優先事項に沿って発売

過去24時間における国内発表は、スーパーノードインテリジェントコンピューティング、オープンソースシステム、3D生成に重点が置かれ、海外投資はコンテンツプラットフォーム、企業拡大、研究開発の優先分野への...

OpenAIは「GPT-5-Chat-Safety」を有効にしてGPT-4oの会話を静かに引き継いだと噂されていますが、公式文書は公開されていません。

OpenAIは「GPT-5-Chat-Safety」を有効にしてGPT-4oの会話を静かに引き継いだと噂されていますが、公式文書は公開されていません。

「GPT-5-Chat-SafetyがGPT-4oの感情的な会話を舞台裏で引き継いだ」という主張については、X、Reddit、Threadsなどのプラットフォーム上で、少数の自己報告とログのスクリーン...

MWC上海がロボットのペナルティシュートアウトを開催:具現化された知能が公衆試験会場に移動する

MWC上海がロボットのペナルティシュートアウトを開催:具現化された知能が公衆試験会場に移動する

2026年6月1日、IT HomeはGSMAが本日、2026年6月24日から25日まで上海MWCでテーマイベントとして「ヒューマノイドロボットペナルティシュートアウト」を開催することを正式に発表したと...

CodexがWindows制御をサポートする:AIプログラミングエージェントがクロスプラットフォームコラボレーションを開始

CodexがWindows制御をサポートする:AIプログラミングエージェントがクロスプラットフォームコラボレーションを開始

2026年6月1日時点でも、OpenAIヘルプセンターのChatGPTリリースノートは最新の更新として表示されています。5月29日のエントリーには次のように記載されています:Codexは現在、Code...

おすすめツール

もっと見る