FLUX.2 オープンソース:Black Forest Labsの次世代画像生成および編集モデル

FLUX.2 オープンソース:Black Forest Labsの次世代画像生成および編集モデル

1. 概要 FLUX.2はBlack Forest Labsが発売した次世代のビジュアル生成および編集モデルで、単なるシーンのデモンストレーションではなく、実際の制作レベルのクリエイティブワークフローを対象としています。 最大約4MP解像度、マルチリファレンス画像入力、細かいタイポグラフィのテキスト...

Admin
401
HunyuanOCRオープンソース:1Bパラメータを用いたエンドツーエンドのマルチシナリオOCRエキスパートモデル

HunyuanOCRオープンソース:1Bパラメータを用いたエンドツーエンドのマルチシナリオOCRエキスパートモデル

1. 要約 HunyuanOCRは、騰訊のHunyuanチームがオープンソース化したエンドツーエンドのOCRエキスパートモデルで、Hunyuanのネイティブマルチモーダルアーキテクチャとトレーニング戦略に基づいており、約10億パラメータでOCRBench(<3Bスケール)およびOmniDocBenc...

Admin
154
AMO-Benchリリース:IMOレベルの数学競技のための大規模モデル推論ベンチマーク

AMO-Benchリリース:IMOレベルの数学競技のための大規模モデル推論ベンチマーク

1. Abstract AMO-Benchは、美団のLongCatチームが立ち上げた高度な数学的推論ベンチマークで、国際数学オリンピアード(IMO)レベルからさらに高難易度の競技問題に焦点を当てています。 ベンチマークは50問の新しい人間が設計した問題で構成されており、システムは自動スコアリングと人...

Admin
105

おすすめツール

もっと見る