LightricksのLTXチームは、LTX-2が20秒間の連続動画と同期音声生成をサポートするようになったと発表しました。これは「単一のキューの直後に連続ショットが続くシーン」を対象としています。Xとブログに投稿された公式発表では、この機能がLTX API Playgroundでテスト可能であることが強調されており、スレッドにはサンプルとトライアルリンクが含まれています。以前公開された情報では、LTX-2の初期バージョンは10秒間のシーケンスをサポートしていたとされていましたが、今回のアップグレードでは継続時間と連続性に重点を置き、会話、音楽、環境音と映像の同期生成を重視しています。
エコシステムの実装に関しては、LTX-2のウェブサイトとブログでは、Fal、Replicate、RunDiffusion、ComfyUIなどのプラットフォームとの統合について言及されており、プロダクショングレードのワークフローと4K品質へのアプローチが強調されています。GitHubリポジトリの更新履歴には、「オーディオとビデオの同時生成、4K、長時間生成」といった機能も記載されています。20秒の効果と安定性については、公式ドキュメントでセリフ、カメラワーク、エモーショナルな音楽の同期を例を通して実証していますが、より広範な外部再現と評価が引き続き求められています。
よくある質問
Q: LTX-2は現在どれくらいの時間生成できますか?
A: 最新の外部規格では、1セッションあたり20秒で、同期された連続的なオーディオとビデオの出力が規定されています。以前の規格では10秒と規定されていましたが、これは機能拡張です。
Q: どこで体験できますか?
A: LTX API プレイグラウンドは現在、すぐに試用できます。公式の X 投稿スレッドに例と直接リンクが提供されています。
Q: どのような統合とプラットフォームがサポートされていますか?
A: 公式声明によれば、開発と展開を容易にするために、Fal、Replicate、RunDiffusion、ComfyUI などのエコシステムと統合されているとのことです。
Q: オープンソースおよびモデル リポジトリにはどのような更新が加えられましたか?
A: GitHub リポジトリには、オーディオとビデオの共生成、解像度、および継続時間に関する LTX-2 の重要なポイントが記録されています。一部のホスティング プラットフォームでは、「LTX-2 Fast」などの推論構成が提供されています。
Q: 同様のビデオ モデルと比較した際の利点は何ですか?
A: 「シーンレベル」のワンショット出力とオーディオとビジュアルの同期を重視し、ポストプロダクションのスプライシングとダビングを削減し、コマーシャル、短編映画、サンプルの反復に適しています。