戻るAIはオープンソースです
Matrix-Game 2.0: リアルタイムゲーム生成のための 1.8B パラメータ オープンソース ワールド モデル

Matrix-Game 2.0: リアルタイムゲーム生成のための 1.8B パラメータ オープンソース ワールド モデル

AIはオープンソースです Admin 154 回閲覧

Matrix-Game 2.0は、Skywork AIがリリースしたオープンソースの生成ワールドモデルで、わずか1.8Bパラメータで約640×352解像度、約640352で微分レベルのインタラクティブゲームシーンをリアルタイムで生成でき、WASDキーボード操作による制御をサポートすることが中心的なハイライトです。 この成果により、AI が生成した世界は理論からプレイアビリティへと移行しました。


1. Matrix-Game 2.0 の主な利点

軽量
  1. かつ効率的: パラメータの数はわずか 1.8B ですが、Few-step Auto-regressive Diffusion テクノロジーにより、毎秒 25 フレームの安定した出力を実現し、数分での連続生成をサポートします。
  2. 強力なインタラクティブ性:組み込みのキーボード/マウスアクションインジェクションメカニズムにより、ユーザーのリアルタイム操作は、次に生成される各フレームに影響を与えます。
  3. 豊富なトレーニングデータ:モデルトレーニング用のUnreal EngineとGTA5などのゲームエンジンをベースに、約1,200時間の高品質インタラクティブビデオを生成します。


2. Matrix-Game 2.0 のパフォーマンスGameWorld

  1. Score ベンチマークでは、画質、タイミングの一貫性、アクション応答の精度、その他の指標が同様のオープンソース モデル Oasis よりも優れています。
  2. 動作遅延が短く、相互作用フィードバックがスムーズであるため、リアルタイム世界モデルの可能性の実証と研究に適しています。


3. 現在の制限と欠点

  1. 低解像度: 公式のデモビデオ解像度は 640×352 で、レトロな CRT モニターの画像テクスチャに近いです。
  2. 高い実行要件: スムーズなレンダリングには FlashAttention と NVIDIA Apex が必要であり、実行にはハイエンド GPU が適しています。


4. 注目に値する理由 Matrix-Game 2.0

  1. は完全にオープンソースであり、モデルの重みとコード、MIT ライセンスを提供し、科学研究と二次開発に適しています。
  2. 強力な実装: 生成ワールド モデルとリアルタイムで制御可能なインタラクションを組み合わせることで、将来の AI ゲームや仮想世界の可能な道筋が示されます。


よくある質問Q

: Matrix-Game 2.0 は直接商品化できますか?

A: このモデルはMITオープンソースライセンスに基づいてライセンスされており、契約に基づいて商用的に入手できますが、生成されたコンテンツのコンプライアンスに注意を払う必要があります。

Q: 解像度を高めることはできますか?

A: これは理論的には、高解像度のトレーニングや超解像の後処理によって実現できますが、計算コストが増加します。

Q: ゲーム以外にどのようなシナリオで使えますか?

A: 仮想トレーニング環境、ロボット シミュレーション、視覚研究、および動的画像のリアルタイム生成を必要とするその他のシナリオで使用できます。


オープンソースアドレス:

https://huggingface.co/Skywork/Matrix-Game-2.0


関連記事

GEO最適化はどのような業界に適していますか? ジェネレーティブエンジン最適化のための7つの高い可能性を秘めた領域

GEO最適化はどのような業界に適していますか? ジェネレーティブエンジン最適化のための7つの高い可能性を秘めた領域

GEO最適化とはどのような業界ですか GEO最適化(Generative Engine Optimization)は、コンテンツが生成AIによって参照されやすくする戦略です。 検索ランキングのみに焦点...

DeepSeek R2 リリースの噂: 憶測的なハイライトと変更の可能性

DeepSeek R2 リリースの噂: 憶測的なハイライトと変更の可能性

DeepSeek R2は、中国のAI企業DeepSeek(DeepSeek)が企画した次世代生成モデルです。 当初のリリース時期は正式に明らかにされていませんが、フィナンシャルタイムズやロイターなどの...

Mem0はエージェントと統合する価値がありますか? 長期記憶は役立ちますが、境界線を管理する必要があります

Mem0はエージェントと統合する価値がありますか? 長期記憶は役立ちますが、境界線を管理する必要があります

Mem0は、AIアプリケーションやエージェント向けのオープンソースメモリ層プロジェクトで、アプリのユーザーの好み、歴史的事実、長期的な文脈を記憶するのを支援することを目的としています。 パーソナライズ...

ヘイスタックはどのようなチームに適しているのでしょうか? むしろコンポジタブルなRAGエンジニアリングフレームワークのようなものです

ヘイスタックはどのようなチームに適しているのでしょうか? むしろコンポジタブルなRAGエンジニアリングフレームワークのようなものです

HaystackはDeepSetが保守するオープンソースのAIアプリケーションフレームワークで、RAG構築、ドキュメントQ&A、検索パイプライン、LLMワークフローの構築に一般的に使用されています。 ...

おすすめツール

もっと見る