知浦のプラットフォームは Z.ai、GLM-4.6Vシリーズのビジュアル言語モデルの発売を発表しました。これには、106Bのパラメータスケールを持つクラウドおよび高性能クラスタシナリオ向けのGLM-4.6V、ローカルおよび低遅延シナリオ向けの軽量版GLM-4.6V-Flashが含まれます。 公式の導入によると、GLM-4.6Vは最大128Kトークンコンテキストの訓練をサポートし、画像、テキスト、ファイルなどのマルチモーダル入力を同時に処理でき、同じサイズのモデルで高い視覚的理解能力を実現しています。
能力設計の面では、GLM-4.6Vシリーズは初めてネイティブの関数呼び出し機能をビジョンモデルのファミリーに統合し、画像や長いドキュメントの理解に基づいてツールやビジネスインターフェースをトリガーし、マルチモーダルエージェントアプリケーションのインフラを提供します。 開発者は Z.ai が提供するオンライン対話ページを通じてモデルを体験したり、APIインターフェースを使って自分のビジネス内で通話を統合したりできます。 同時に、Hugging Faceではモデルの重みが一般公開されており、計算能力のあるチームがローカルまたはプライベートで展開しやすくしています。
料金に関しては、Z.ai が発表したAPI請求は百万トークン単位で計算され、GLM-4.6Vクラウド推論は入出力ごとに別々に請求され、Flash版は現在無料と表示されており、コストや遅延に敏感なアプリケーションシナリオに適しています。 具体的な価格、期間限定オファー、クォータルールは開発者のドキュメントやコンソールの宣伝に従わざるを得ず、ユーザーはマルチモーダルデータアップロードのアカウント割当、セキュリティコンプライアンス、プライバシー保護の問題に注意を払う必要があります。
よくある質問:
GLM-4.6Vのモデルは何ですか?
A: GLM-4.6Vは Z.ai が発売したマルチモーダルの大規模モデルで、画像やテキストなどの入力を同時に処理でき、長い文脈や推論能力もサポートします。
Q: GLM-4.6VフラッシュとGLM-4.6Vの違いは何ですか?
A: GLM-4.6V-Flashは軽量で高速なバージョンで、オンプレミスの展開や低遅延アプリケーションにより適しています。一方、GLM-4.6Vはクラウドや高性能クラスタシナリオに適しています。
Q: GLM-4.6Vシリーズモデルはどのように体験できますか?
A: 一般ユーザーはZ.aiのオンラインチャットページで体験でき、開発者は公式APIを通じて自分のアプリに統合できます。
Q: GLM-4.6Vは機能呼び出しをサポートしていますか?
A: GLM-4.6Vシリーズはネイティブ関数呼び出しをサポートしており、画像やドキュメントを解析した後、外部ツールやビジネスインターフェースを呼び出すために使えるため、マルチモーダルエージェントの構築が容易です。
Q: GLM-4.6VおよびGLM-4.6Vフラッシュの価格はいくらですか?
A: GLM-4.6VはAPI呼び出しに対して入出力の100万トークン単位で課金されており、GLM-4.6V-Flashは公式価格ページで現在無料と表示されています。