戻るAIはオープンソースです
Apple ml-sharp(SHARP)オープンソース解釈:単一の写真から数秒で3Dガウススプラットを生成する新しいパースペクティブ合成方式

Apple ml-sharp(SHARP)オープンソース解釈:単一の写真から数秒で3Dガウススプラットを生成する新しいパースペクティブ合成方式

AIはオープンソースです Admin 451 回閲覧

1. 要旨

ml-sharpはAppleによるSHARPプロジェクトのコードとモデルのオープンソース実装であり、単一の画像から直接3Dガウス(3DGS)シーン表現に返し、標準GPU上で「1秒未満」の推論生成を達成することを目的としています。 結果として得られた3DGSは、近傍視点からの高解像度の新しい視点合成のためにリアルタイムレンダリング可能で、「メトリック」と絶対スケールを強調し、実際のカメラの動きにより近いナビゲーションとレンダリングを可能にします。

2. コア機能

  1. 3DGS→単一画像:1枚の写真を入力し、3Dガウススプラット(.ply)をシーン表現として出力します。これにより、さまざまな3DGSレンダリング/ビューツールへのアクセスに便利です。
  2. 第二レベル生成:単一の順方向ネットワーク回帰3Dガウスパラメータを使用し、低遅延とインタラクティブな体験に重点を置きます。
  3. 測定可能なスケール:出力は絶対スケールとカメラの動きで測定属性を表し、カメラの軌道レンダリングやAR/VRプレビューにより適しており、「リアルな距離感」があります。
  4. ゼロショット一般化:データセット全体にわたる堅牢な一般化方式として位置づけられ、「任意の写真」を閲覧可能な3D表現に素早く変換することに適しています。

5. エンジニアリングCLI:バッチ予測、チェックポイント指定、生成されたガウスの軌道レンダリングをサポートするsharpコマンドラインツールを提供します(ハードウェアの制限あり)。

3. 設置

1. 環境を作る(例):conda create -n sharp python=3.13、次にconda activate sharp

2. 依存関係をインストールする:リポジトリのルートディレクトリでpip install -r requirements.txtを実行します。

3. インストールの確認:コマンドが利用可能かどうかsharp --help実行します。

4. デフォルトのモデル重みは初回実行時に自動的にダウンロードされ、ローカルにキャッシュされます(READMEのリンクに従って手動でダウンロードし、-cで指定することもできます)。

4. 典型的なユースケース

  1. 3Dコンテンツの迅速な「ドラフト」:単一の映像写真を素早く3DGSに変換し、概念実証、レンズリハーサル、インタラクティブディスプレイに利用します。
  2. AR/VRシーンプレビュー:写真をナビゲート可能なシーンに変換し、クローズアップの視点移動と没入感のある視聴を可能にします。
  3. 3Dアセットパイプラインの前線:2D参照マップをレンダリング可能なクローズアップ3D表現に変換し、後の再構築・編集のための初期形態を提供します。
  4. 研究と評価:異なる新しい視点合成手法の速度、詳細、安定性の性能を比較し、実験結論を再現する。

5. 生態系と競合製品

1. 生態学的接続:SHARPの.ply出力は一般的な3DGSレンダラと互換性があります。 なお、OpenCVの座標規則(xを右に、yを下に、zを前方に)使用しており、サードパーティ製レンダラーではスケーリングや回転、重心の調整が必要な場合があります。

  1. 比較方向性:プロジェクトページでは、Gen3C、ViewCrafter、TMPI、Flash3D、LVSM、SVC など、さまざまな関連手法との視覚的な比較動画が提供されています。 モデルを選ぶ際に通常注目されるのは、生成速度(秒)、ディテールのシャープネス(構造の安定性)、そしてカメラの動きにおける幾何学的な一貫性です。

6. 制限事項と注意事項

1. レンダリングトラックのハードウェア制限:3DGS生成の予測はCPU/CUDA/MPSなどの環境で実行可能ですが、--renderを通じた映像トラックのレンダリングには現在CUDA GPUが必要です。

  1. 単一画像の固有の制限:強い反射、透明なオブジェクト、繰り返しのテクスチャ、遮蔽されたシーンでは、ジオメトリやテクスチャがずれたりアーティファクトが生じたりする可能性があるため、入力と結果を手動でフィルタリングすることが推奨されます。
  2. サードパーティのレンダリング互換性詳細:ビューアによって座標系、単位スケール、色/属性フィールドの慣習が異なるため、例外をインポートする際には座標とスケール変換を必ず確認してください。
  3. ライセンスおよび商業利用:コードとモデルの重みは異なるライセンス条件を採用する場合があります。 商品化や商業利用をする前に、必ず倉庫のライセンスとLICENSE_MODELをよく読みましょう。

7. プロジェクトアドレス

https://github.com/apple/ml-sharp

8. よくある質問

Q: ml-sharp(SHARP)が出力する3DGSファイルのフォーマットと使い方は?

A: デフォルトの出力は3Dガウススプラットの.plyファイルで、一般的な3DGSレンダリング/表示ツールにインポートしてインタラクティブなブラウジングやレンダリングが可能です。

Q: ml-sharpのモデルの重みは自動的にダウンロードされますか?また、キャッシュはどこにありますか?

A: 予測の最初の実行では、デフォルトのチェックポイントが自動的にダウンロードされ、ローカルユーザーディレクトリのTorchチェックポイントキャッシュパスにキャッシュされます。 手動でダウンロードし、-cで指定することも可能です。

Q: なぜ sharp predict --renderでエラーが出たり、 動画をレンダリングできなかったりするのですか?

A: トラック映像レンダリングは現在CUDA GPUに依存しています。 もし環境にCUDAツールチェーンがなかったり依存関係を満たしていない場合は、.plyだけビルドし、他のレンダラーを使って可視化を完成させることが推奨されます。

Q: ml-sharpはMac(MPS)で動作しますか?

A: 予測(3DGS生成)は通常、サポートされたデバイスバックエンド上で実行可能ですが、軌道レンダリングは依然としてCUDAを前提としています。 Macでは外部ツールで.ply・レンダリングが可能です。

Q: SHARPは「長距離シーン」での自由なローミングに適していますか?

A: 近距離視点の新しい視点合成や短距離カメラ移動により適しています。 大きな変位、強い遮蔽、視野角の極端な変化は画質の劣化を引き起こす可能性があります。

ml-sharp オープンソース SHARP 単一画像回帰 3DGS フル解析 SHARPは単一の写真の3D生成を可能にします ガウスシーンは次のように表します 3DGSのml-sharpセカンドレベル推論生成工学の実装 SHARP出力は3DGSの利点を絶対スケールで測定しています mlシャープなゼロショットの一般化は、どんな写真でも数秒で3Dに変換します SHARPは3DGS用のPLYフォーマットと使用ガイドを生成します ML-シャープは CLIバッチ予測およびレンダリングプロセス SHARPは標準GPUで1秒未満で3DGSを生成します ML-Sharpは高解像度の新しいパースペクティブ合成とナビゲーションに使用されます SHARPは、メトリックスケールがリアルなカメラモーションレンダリングをサポートすることを強調しています ML-Sharpインストール構成 CONDA with dependncies complete steps SHARPは初めて自動ダウンロード重量とキャッシュ位置命令を実行します ml-sharp チェックポイントパラメータでモデルの重みを切り替える方法 SHARPはCPU CUDAをサポートしています MPS推論実行戦略 なぜML-sharpでトレース動画をレンダリングするのにCUDAグラフィックカードが必要なのですか? SHARP単一グラフから3DGSネットワーク回帰のアイデアへの解釈 ARVRシーンプレビューにおけるml-sharpの応用シナリオ SHARPは2D参照マップをレンダリング可能なクローズアップ3D表現に変換します ML-Sharpは3Dコンテンツの迅速なドラフト作成とショットプレビューに使用されます SHARPが一般的な3DGSレンダラーにアクセスするための互換性ポイント ml-sharpがOpenCV座標系のインポート注意事項を採用しています SHARP座標スケーリング、回転重心調整 ml-sharpやGen3Cおよびその他の手法 スピードとディテールの面でSHARPとViewCrafterの比較 Flash3Dの幾何学的整合性観察と比較したml-シャープ SHARPが近接視点や新しい視点合成に適した理由 ML-シャープは長距離を移動する大きなシーンの境界には適していません SHARP:高反射率の透明物体上の一般的なアーティファクト解析 ML-Sharpは、繰り返しのテクスチャがシーンを遮断する品質リスクに直面しています SHARPの結果ドリフトとアーティファクト入力フィルタリングの提案 ML-Sharpインポートサードパーティビューアカラーフィールド互換性ガイド 異なるレンダラー向けのSHARPユニットスケール差分処理方法 ml-sharpは3DGS資産のパイプライン前解をバッチで生成します SHARPは、その後の再構成編集のために初期パターンの値を提供します ML-Sharpは速度詳細の安定性を研究・評価するために用いられます SHARPのリアルタイムレンダリングとインタラクティブ体験の主な利点 ml-sharp ブラウズ可能な3DGSの生成方法とPLYのエクスポート方法 シャープ コマンドパラメータ設計とベストプラクティスを予測する Macでmpsを使ってml-sharpで実行可能な経路を推測します SHARPはMac上でPLYの外部レンダリング後レンダリング方式を生成します ml-sharpレンダリングエラーのトラブルシューティングとCUDAツールチェーンチェック SHARPの第2レベル生成はインタラクティブな3Dドラフトワークフローをもたらします ARプレビュー用のmlシャープでリアルな距離感応カメラトラック SHARPは幾何学的な一貫性を強調し、カメラの動きの安定性を向上させます 微細構造におけるmlシャープとTMPIの安定性の比較 推論遅延におけるSHARPとLVSMのトレードオフ ML-Sharpのライセンスと商用利用前に確認すべき用語のリスト

関連記事

ManusとMetaが協力してAIエージェントの推進:サブスクリプションは変わらず、シンガポールは引き続き運営を続けています

ManusとMetaが協力してAIエージェントの推進:サブスクリプションは変わらず、シンガポールは引き続き運営を続けています

AIエージェント製品Manusは、チームがMetaに加盟することを発表し、Manusの一般的なAIエージェントとしての活動を認める形で位置づけています。 発表によると、リリース以来、Manusは研究、...

人工知能の擬人化されたインタラクティブサービス管理のための暫定措置の解釈(コメントのための草案)。

人工知能の擬人化されたインタラクティブサービス管理のための暫定措置の解釈(コメントのための草案)。

2025年12月27日に中国サイバースペース管理局が発表した公聴案を踏まえ、本記事は、背景での適用範囲、データおよびユーザー保護の促しと退出、セキュリティ評価、プラットフォーム責任監督の核心要件に基づ...

Mem0はエージェントと統合する価値がありますか? 長期記憶は役立ちますが、境界線を管理する必要があります

Mem0はエージェントと統合する価値がありますか? 長期記憶は役立ちますが、境界線を管理する必要があります

Mem0は、AIアプリケーションやエージェント向けのオープンソースメモリ層プロジェクトで、アプリのユーザーの好み、歴史的事実、長期的な文脈を記憶するのを支援することを目的としています。 パーソナライズ...

ヘイスタックはどのようなチームに適しているのでしょうか? むしろコンポジタブルなRAGエンジニアリングフレームワークのようなものです

ヘイスタックはどのようなチームに適しているのでしょうか? むしろコンポジタブルなRAGエンジニアリングフレームワークのようなものです

HaystackはDeepSetが保守するオープンソースのAIアプリケーションフレームワークで、RAG構築、ドキュメントQ&A、検索パイプライン、LLMワークフローの構築に一般的に使用されています。 ...

おすすめツール

もっと見る