I. 基本情報
Captionsは、Mirageを搭載したAI動画制作・編集プラットフォームです。AI動画編集、テキストから動画への自動字幕作成、リップシンクと多言語吹替、デジタルヒューマン生成、視線追跡補正といった主要機能を備えています。モバイルおよびWebプラットフォーム上で、脚本から完成作品までの包括的な制作プロセスを重視しており、ショートビデオクリエイター、ブランドやeコマースチーム、教育・研修機関、スケーラブルな出力を求めるコンテンツスタジオなどに最適です。
II. 製品概要
Captionsは、会話とタイムラインを組み合わせた編集手法でワークフローを体系化します。ユーザーは、素材を直接録画・アップロードしたり、AI Creatorとスクリプトを使って下書きを素早く作成したりできます。字幕生成とスタイル管理、自動ダビングとBGM、多言語翻訳とダビングアライメント機能も提供します。プレゼンテーションやオンスクリーンコンテンツ向けには、Eye Contact視線追跡補正、Denoiseノイズ低減、Zoomインテリジェントアドバンスメント、タイトルカードテンプレートライブラリといったプラットフォームが提供され、複雑な手動編集なしで主要処理を完了できます。俳優を画面に映したいが撮影に手間がかかるユーザーのために、CaptionsはAI TwinsとMirageを使って俳優を生成し、個々の容姿を維持したままリップシンクとボイスマッチング機能を備えた動画を一括生成したり、ライブラリから画像を選択したりすることも可能です。
III. コア機能
1. 主な機能
自動字幕は多言語の文字起こしとスタイル編集をサポートします。
Lipdub は、唇の動きをナレーションと同期させ、さまざまな言語の音声パターンを一致させることができます。
AI Twins は、音声と視覚要素を組み合わせた個人のペルソナを生成し、説明ビデオを作成します。
Mirage は、標準化されたプレゼンテーション イメージと複数の音声スタイルを持つ俳優を生成します。
AI Creator と Chat to Edit を使用すると、プロンプトやダイアログを使用して映像を生成および変更できます。
Eye Contact と Denoise により視覚体験が向上します。
AI 広告と AI ショート テンプレートは、主要なプラットフォームに適合しています。
スクリプト生成とテレプロンプターにより、ワンショット録画が容易になります。
2. 技術的特徴
多言語音声合成および翻訳パイプラインは、整列した字幕と唇の動きをサポートします。
レンズレベルの AI 編集では、ワンクリックのジャンプ カット、自動進行、トランジションの提案がサポートされます。
モバイルファーストおよびクラウドベースのコラボレーション: モバイルフォンと Web ブラウザー間でプロジェクトと履歴を共有します。
上位バージョンでは、モデルの選択性と同時実行性の制御に加え、同時実行性の生成とモデルの切り替えもサポートされます。
IV. 価格とバージョン
Captionsは無料プランと複数のサブスクリプションプランをご用意しています。Pro(月額9.99ドル)、Max(月額24.99ドル)、Scale(月額69.99ドル)です。プランによって、プロジェクト作成、エクスポート時の透かしの制限、モデルの選択、生成されるAIツインの数、生成されるアクターの可用性が異なります。具体的な価格と機能は、公式ウェブサイトおよびヘルプセンターの掲載情報に基づいて変更される場合があります。金額と提供状況は、地域や期間によって異なる場合があります。
V. 適用可能なシナリオと対象者
ショートビデオの作成者は、自動字幕、リップシンク、テンプレートの助けを借りて、毎日のコンテンツ更新を迅速に完了できます。
ブランドや e コマース チームは、AI 広告と多言語のナレーションを使用して、広告クリエイティブを一括生成します。
教育とトレーニングでは、スクリプト生成と目の補正を利用して、コースのマイクロレッスンと指導ビデオを出力します。
翻訳と吹き替えの調整によりスタイルの一貫性を維持しながら、国際的な事業を複数の地域に拡大しています。
メディアおよびコンテンツ スタジオでは、同時生成とモデル切り替えを活用して、並列マルチプロジェクト操作の効率を向上させます。
VI. よくある質問
Q: AI ツインとキャプションで生成された俳優の違いは何ですか?
A: AIツインズはユーザー自身のイメージをベースに作成するため、統一感のあるパーソナルブランドの構築に適しています。アクターは公式ライブラリから提供されるため、ユーザーがカメラに映りにくい場合や、複数の役柄を演じる必要がある場合などにも最適です。
Q: キャプションのリップシンク機能はどのように機能しますか?
A: このプラットフォームは、ナレーションと映像のタイムアライメントを実現します。リップシンク推定と音声アライメント技術により、異なる言語のナレーションでも一貫した唇の動きが維持されるため、多言語リリースに適しています。
Q: モバイル デバイス上での録画と公開を完全にサポートしていますか?
A: はい、携帯電話でテレプロンプターの字幕を録画してエクスポートし、Web バージョンでクラウドと同期させることができます。
Q: 無料版と有料版の違いは何ですか?
A: これは主に、クォータ モデルが透かし付きでエクスポートされるかどうか、同時生成権限 AI ツインの可用性、俳優の可用性、広告や短編映画のテンプレートなどの高度なツールの可用性に反映されます。
Q: Eye Contact と Denoise の適用シナリオは何ですか?
A: Eye Contactは、ポストプロダクションでの目の補正に使用され、カメラをまっすぐ見つめているようなプロフェッショナルな印象を与えます。Denoiseは、周囲のノイズを低減し、声の明瞭度を高めるために使用され、カジュアルなレコーディングや屋内環境に適しています。