AIはオープンソースです - Page 7 - AIツールナビゲーション

AI情報 AI百科事典 AIレコメンデーション AIコンプライアンス AIはオープンソースです AIプロンプト AIニュースブリーフィング AI Q&A(英語) AIハードウェア

HPC-Opsのオープンソース解釈:騰訊のHunyuan本番用LLM推論オペレーターライブラリがH20のような推論カードの性能をいかに絞り出すか

1. 要旨 HPC-Opsは、騰訊のHunyuan AI Infraチームによるオープンソースの実用グレードLLM推論オペレーターライブラリであり、主流の推論カード(特にNVIDIA Hopper/SM90、例えばH20)をハードウェアの利用率に近づけることを目的としています。このプロジェクトは、...

Admin • 2026/1/27

124

DeepSeek-OCR 2リリース:ビジュアル・インコーズフローにより文書や図の認識がより「人間らしく」

1. 要旨 DeepSeek-OCR 2は、DeepSeekのオープンソースOCR/ドキュメント理解モデルのアップグレード版であり、「DeepSeek-OCR 2: Visual Causal Flow」をテーマに、より人間に優しい視覚コーディング手法を強調し、複雑なレイアウト(ドキュメント、チャー...

Admin • 2026/1/27

198

Kimi K2.5 オープンソースマルチモーダルエージェント完全ソリューション:ビジュアルプログラミングおよびエージェントスウォームとの並列協働

1. 要旨 Kimi K2.5はMoonshot AIがリリースしたオープンソースの「ビジョン+エージェント」マルチモーダルモデルで、統一された画像/映像およびテキスト入力をサポートし、ダイアログモードとエージェントモードを提供します。ビジョン駆動型コーディングと視覚的デバッグ、ロングリンクツール...

Admin • 2026/1/27

201

Qwen3-TTSオープンソースリリース:12Hz高圧縮トークナイザー+3秒のトーンクローン遊び方

1. 要旨 Qwen3-TTSは、Qwenチームによるオープンソースのテキスト読み上げ(TTS)モデル群で、VoiceDesign(テキスト説明から新しい音声を生成する)、CustomVoice(あらかじめ決められた高品質音声のコマンド制御)、Base(高速音声クローン作成および基礎の微調整)などが...

Admin • 2026/1/23

126

Chroma 1.0 リリース:世界初のオープンソースのエンドツーエンドリアルタイム音声間モデル

- 要旨 Chroma 1.0は、FlashLabsによって訓練され、完全にオープンソース化されたエンドツーエンドのリアルタイム音声間モデルで、パーソナライズされた音声クローン作成を可能にします。このモデルは従来のASR→LLM→TTSパイプラインを不要にし、エンドツーエンドの応答を約150msで...

Admin • 2026/1/22

オープンソース画像生成の新たな選択肢:GLM-Imageのアーキテクチャ、機能、実装シナリオ

1. 要旨 GLM-Imageは Z.ai 年のオープンソース画像生成モデルで、「離散的自己回帰生成+拡散復号」というハイブリッドパラダイムを採用しています。自己回帰モジュールはグローバルセマンティクスとレイアウト計画を担当し、拡散デコーダは高精度な詳細で補完されます。公式情報によると、全体的な画...

Admin • 2026/1/14

103

HPC-Opsのオープンソース解釈:騰訊のHunyuan本番用LLM推論オペレーターライブラリがH20のような推論カードの性能をいかに絞り出すか

DeepSeek-OCR 2リリース:ビジュアル・インコーズフローにより文書や図の認識がより「人間らしく」

Kimi K2.5 オープンソースマルチモーダルエージェント完全ソリューション:ビジュアルプログラミングおよびエージェントスウォームとの並列協働

Qwen3-TTSオープンソースリリース:12Hz高圧縮トークナイザー+3秒のトーンクローン 遊び方

Chroma 1.0 リリース:世界初のオープンソースのエンドツーエンドリアルタイム音声間モデル

オープンソース画像生成の新たな選択肢:GLM-Imageのアーキテクチャ、機能、実装シナリオ

おすすめツール

AIツールを投稿

投稿情報を確認してください

Qwen3-TTSオープンソースリリース:12Hz高圧縮トークナイザー+3秒のトーンクローン遊び方