Gemini 3 フラッシュログインAPI:入力$0.50/百万トークン、出力$3.00/百万トークン
Googleは、 高速・低遅延・大規模利用に特化した新世代の軽量で最先端モデル「Gemini 3 Flash」の発売を発表しました。多くのレビューではGemini 2.5 Proよりも強力で、コーディングやツール呼び出し機能を大幅に強化しています。 このモデルはGemini API/AI Studi...
Googleは、 高速・低遅延・大規模利用に特化した新世代の軽量で最先端モデル「Gemini 3 Flash」の発売を発表しました。多くのレビューではGemini 2.5 Proよりも強力で、コーディングやツール呼び出し機能を大幅に強化しています。 このモデルはGemini API/AI Studi...
OpenAI開発者向けのドキュメント「画像生成」ページは、画像生成と編集機能の集中説明を提供しています。開発者は画像APIを通じて直接、編集、またはバリエーションを生成できます(バリアントはDALL· E 2 支援)、そして「image_generation」は、Responses APIの組み込み...
Xiaomi MiMoとXiaomi大型モデルCoreチームはMiMo-V2-Flash関連リソースを公開・公開し、高速推論やエージェントワークフローの基本言語モデルとして位置づけ、モデルの重みと推論展開データを開発者と研究者に同時に提供しています。 このモデルはMixture-of-Experts...
OpenAIは2025年12月16日にChatGPT Imagesの新バージョンをリリースし、新しい旗艦画像生成モデルを搭載し、指示遵守、編集精度、詳細保持の向上に注力し、生成速度を最大4倍に向上させることを明かしました。 公式説明では、新しいモデルはアップロード画像を修正する際に「ユーザーが要求し...
MetaはSAM Audio(SAM-Audio)を立ち上げました。これは「統一された」音声セグメンテーションおよび編集AIモデルとして位置づけられ、複雑なミックスで特定の音を迅速に分離・編集することを目標としています。 典型的なユースケースには、バンドのビデオからギターやボーカルを個別に抽出するこ...
美団のLongCatチームは、LongCat-VideoコードベースのアップデートでLongCat-Video-Avatarのリリースを発表し、同時にプロジェクトページとHugging Faceの重りを公開しました。 LongCat-Videoアーキテクチャをベースに、このモデルはAudio-Tex...