OpenAI画像生成ガイドの更新:GPT画像および画像APIとレスポンスAPIの利用に関する重要なポイント

OpenAI画像生成ガイドの更新:GPT画像および画像APIとレスポンスAPIの利用に関する重要なポイント

OpenAI開発者向けのドキュメント「画像生成」ページは、画像生成と編集機能の集中説明を提供しています。開発者は画像APIを通じて直接、編集、またはバリエーションを生成できます(バリアントはDALL· E 2 支援)、そして「image_generation」は、Responses APIの組み込み...

Admin
164
OpenAIが新しい旗艦画像モデルをリリース:ChatGPT ImagesがGPT Image 1.5と同時にリリース

OpenAIが新しい旗艦画像モデルをリリース:ChatGPT ImagesがGPT Image 1.5と同時にリリース

OpenAIは2025年12月16日にChatGPT Imagesの新バージョンをリリースし、新しい旗艦画像生成モデルを搭載し、指示遵守、編集精度、詳細保持の向上に注力し、生成速度を最大4倍に向上させることを明かしました。 公式説明では、新しいモデルはアップロード画像を修正する際に「ユーザーが要求し...

Admin
85
SAM AudioがSegment Anything Playgroundを起動:ミックストラックから任意の音源を抽出

SAM AudioがSegment Anything Playgroundを起動:ミックストラックから任意の音源を抽出

MetaはSAM Audio(SAM-Audio)を立ち上げました。これは「統一された」音声セグメンテーションおよび編集AIモデルとして位置づけられ、複雑なミックスで特定の音を迅速に分離・編集することを目標としています。 典型的なユースケースには、バンドのビデオからギターやボーカルを個別に抽出するこ...

Admin
163
美団のLongCatチームは、長年使われてきたスピーカー動画生成と多キャラクターシーンのためのLongCat-Video-Avatarを立ち上げました

美団のLongCatチームは、長年使われてきたスピーカー動画生成と多キャラクターシーンのためのLongCat-Video-Avatarを立ち上げました

美団のLongCatチームは、LongCat-VideoコードベースのアップデートでLongCat-Video-Avatarのリリースを発表し、同時にプロジェクトページとHugging Faceの重りを公開しました。 LongCat-Videoアーキテクチャをベースに、このモデルはAudio-Tex...

Admin
126

おすすめツール

もっと見る