Apple ml-sharp(SHARP)オープンソース解釈:単一の写真から数秒で3Dガウススプラットを生成する新しいパースペクティブ合成方式
1. 要旨 ml-sharpはAppleによるSHARPプロジェクトのコードとモデルのオープンソース実装であり、単一の画像から直接3Dガウス(3DGS)シーン表現に返し、標準GPU上で「1秒未満」の推論生成を達成することを目的としています。 結果として得られた3DGSは、近傍視点からの高解像度の新し...
1. 要旨 ml-sharpはAppleによるSHARPプロジェクトのコードとモデルのオープンソース実装であり、単一の画像から直接3Dガウス(3DGS)シーン表現に返し、標準GPU上で「1秒未満」の推論生成を達成することを目的としています。 結果として得られた3DGSは、近傍視点からの高解像度の新し...
1. 要旨 MAI-UIは、Tongyi-MAI(Tongyi Lab)によってオープンソース化された汎用GUIエージェントベースおよびサポートコードであり、「画面を見て、指示を理解し、インターフェースを操作する」という自動化されたタスクを目的としています。 このプロジェクトは、実際の展開に必要な3...
1. 要旨 MiniMax M2.1は、MiniMaxがリリースしたオープンソースの権利モデルで、「実際のソフトウェア開発+エージェント」シナリオに焦点を当て、コーディングの堅牢性、ツール呼び出し、命令準拠、ロングリンク計画の強化、ローカル展開およびツールコールのガイドラインを提供しています。 モデ...
1. 要旨 QwenLong-L1.5は、Tongyi ZhiwenチームがQwen-Docリポジトリでオープンソース化した「長いコンテキスト推論+メモリ管理」のトレーニング後レシピのセットです。 このシステムは3つの要素を中心に展開しています。すなわち、長文のための複雑な推論データ合成、長距離列の...
1. 要旨 GLM-4.7はzai-orgがリリースしたオープンソースの権利重視言語モデルです。 公式情報によると、GLM-4.6と比べてコーディング能力、複雑な推論能力、多段階ツールの使用が大幅に向上し、対話、創作、ロールプレイなどの一般的なシナリオのパフォーマンスも向上させています。 実際の効果...
1. 要旨 BloomはオープンソースのLLM行動評価生成フレームワークです。研究者は「ターゲット行動」と再現可能なシード構成を定義するだけで、Bloomは自動的に多数のトリガーシナリオを生成し、ターゲットモデルとやり取りします。レビューモデルは行動の頻度と強度をスコアリングし、迅速なスケーラブル行...