1. 基本情報
文心易画は、百度(バイドゥ)が立ち上げたAIを活用したアート・クリエイティブ支援プラットフォームです。PaddlePaddleディープラーニングプラットフォームと文心ビッグモデルを活用し、テキストから画像を生成する機能を提供します。ユーザーは中国語または英語の説明を入力し、スタイルとフレームを選択するだけで、高解像度の画像を生成します。このプラットフォームは、カジュアルなクリエイターとプロのデザイナーの両方を対象としており、イラスト、伝統的な中国ポスター、写実的なフィクション、アニメなど、多様なテーマをカバーし、言葉が絵画になるような、参入障壁の低いクリエイティブ体験を重視しています。
2. 製品概要
テキストベースの画像を中心としたWenxin Yigeは、スタイルと構成のコントロールを組み合わせ、ユーザーがインスピレーションをクリエイティブな素材へと素早く変換できるよう支援します。このプラットフォームは、多様なスタイルと一般的な縦横比のテンプレートを提供しており、ソーシャルメディアのカバー、eコマースのメイン画像、ブランドポスターなど、頻繁に使用されるシナリオに適しています。生成プロセスでは、クロスモーダルモデルを活用し、テキストの意味理解と画像合成を組み合わせ、継続的な実験と複数のバリエーションをサポートし、異なるソリューションの迅速な比較を可能にします。また、教育的かつ包括的なクリエイティブシナリオにも対応しており、美術の基礎知識がないユーザーにも直感的なエントリーポイントを提供し、学習の障壁を下げています。
3. コア機能
1. 主な機能
- テキストを画像に変換
- テーマと詳細な説明を入力するだけで画像が生成されます。中国語と英語のプロンプトに対応しており、人物、風景、製品、装飾など、一般的なテーマをカバーしています。
- スタイルと構成の選択
- 伝統的な中国スタイル、油絵、水彩画、ガッシュ、アニメーション、リアリズムなど 10 種類以上のスタイルが組み込まれており、水平、垂直、正方形などのフレーム オプションが提供され、マルチプラットフォームへの適応が容易になります。
- 多様なバリエーションと改良
- 生成された結果は、引き続きバリエーションを生成したり、部分を改良したりして、徐々に目標の視覚効果に近づくことができます。
- 作業管理とエクスポート
- 生成された画像は個人スペースで閲覧・管理でき、高解像度でのエクスポートや再編集もサポートされます。
- アクティビティとテンプレートリソース
- 私たちは、クリエイターが一般的なビジュアルスキームを参照して再利用できるように、テーマ別のアクティビティやスタイルの例を随時提供しています。
2. 技術的特徴
- クロスモーダル生成
- Wenxin マクロモデルと視覚生成サブモデルに基づいて、テキストから画像へのクロスモーダル マッピングが完了し、迅速な理解と詳細の一貫性が向上します。
- パドルフレームサポート
- PaddlePaddle のトレーニングと推論の最適化戦略を活用してエンジニアリング実装を実行し、オンライン サービスの安定性とスループットを確保します。
- 多言語および中国語の強化
- 中国語の説明のきめ細かい属性とスタイルワードを強力にサポートしており、中国語のクリエイティブコンテキストでの正確な制御に適しています。
- 一般の人が簡単に使えるインタラクション
- 直感的なパラメータとスタイル カードを通じて学習コストを削減し、デスクトップとモバイルの入り口に適応します。
- コンテンツとセキュリティポリシー
- 組み込まれた基本的なコンテンツレビューと生成制限により、準拠していないプロンプトを傍受してガイドし、準拠した使用を確保できます。
4. 価格とバージョン
文鑫易格は、無料トライアル枠と付加価値枠を提供しています。新規登録ユーザーは通常、発電用に一定量の電力を受け取ります。この上限を超えた場合は、トップアップまたはプロモーションを通じて追加の電力を受け取ることができます。電力割り当て、価格、特典は時期や地域によって異なる場合があります。実際の電力割り当て量はプラットフォームのページに記載されています。企業や大規模なユースケースでは、百度スマートクラウドと文鑫エコシステムに関連するソリューションを統合できます。機能と条件は公式仕様に準拠します。
5. 適用可能なシナリオと対象者
- ニューメディア・コンテンツチーム
- カバーやイラストを素早く作成し、複数のプラットフォームのアスペクト比に適応し、画像の選択と修正のサイクルを短縮します。
- 電子商取引とブランド運営
- テーマポスターや製品シーンの写真を生成し、スタイルを一括して検討して視覚的なトーンを統一します。
- イラストレーションとビジュアルデザイン
- スタイル スケッチと方向性の検討を実施して、テキストのアイデアを視覚的なソリューションの草案に変換します。
- 教育と訓練
- 教室やトレーニングでテキストから画像へのプロセスを実演し、芸術の専門家以外の人々が創作に取り組むハードルを下げます。
- 文化創造とイベント素材
- 伝統的な中国スタイルと祭りのテーマを組み合わせて、イベントのビジュアル要素をすばやく生成し、制作効率を向上させます。
6. よくある質問
Q: Wenxin Yige はどのようなコア機能をサポートしていますか?
A: 主にテキストから画像を生成する機能を提供し、スタイルの選択とフレーム制御をサポートし、結果のバリエーションと改良をサポートして制御性を向上させます。
Q: Wenxin Yige と Wenxin Da Model の関係は何ですか?
A: Wenxin Yige は、Wenxin ビッグモデルのクロスモーダル機能に基づいてテキストから画像への生成を実現し、PaddlePaddle フレームワークでのトレーニングと推論のエンジニアリング展開を完了しました。
Q: Wenxin Yige ではどのような一般的なスタイルが利用できますか?
A: プラットフォームは、伝統的な中国風、油絵、水彩画、ガッシュ、アニメーション、リアリズムなどの一般的なスタイルをカバーしています。具体的な数量と名前は、バージョンアップデートによって変更されます。
Q: 割り当て量と料金はどのように計算されますか?
A: メーターは電力量やその他の使用量単位で計測されます。登録ユーザーは一定量の無料割り当てを取得できます。割り当て量を超えた場合は、必要に応じて購入、またはアクティビティを通じて取得できます。割り当て量と価格はページに表示されるとおりです。
Q: 生成された作品を商業的に利用できますか?
A: 商用ポリシーと許諾条件は、最新のプラットフォームの指示に従います。ブランド活動や商業活動に使用する前に、関連する規則をよく読んで遵守することをお勧めします。