テンセント・フンユアンチームは、テンセントクラウドAPIを通じて開発者や企業向けに開放されている最新バージョンの言語モデル「テンセントHY 2.0」の公式リリースを発表しました。 このアップグレードは、総パラメータスケール4060億、活性化パラメータ320億のハイブリッドエキスパート(MoE)アーキテクチャを採用し、最大256Kのコンテキストウィンドウをサポートし、数学的推論、コード生成、複雑なタスク実行において前世代モデルと比べて大幅に向上しています。 公式紹介によると、HY 2.0はIMO-AnswerBenchで73.4ポイントを獲得し、SWE-bench VerifiedやTau2-Benchなどのエージェントタスクでも大幅に上昇しました。
HY 2.0は2種類の最適化版を提供します。Tencent HY 2.0 Thinkは深掘り、コード生成、複雑な命令シナリオを対象としており、クラウドインターフェースは最大入力128K、出力64Kに対応しており、長文、複数ラウンドの対話、難しい推論能力に重点を置いています。 Tencent HY 2.0 Instructは、日々の会話、作成、高並行性サービスを対象としており、最大入力は128K、出力は16Kで、応答性と普遍的な安定性を重視しています。 訓練戦略に関しては、RLVR+RLHFの二段階強化学習の導入を強調し、「思考の深さ」と生成効率を長さペナルティとタスクサンドボックス設計と組み合わせたバランスを取っています。
現在、HY 2.0はTencent Yuanbaoなどの自社アプリケーションに接続されており、Tencent Cloud上でAPIコールや企業アクセス機能を提供しています。 具体的な価格、現在の制限戦略、さらに技術的な詳細はテンセントクラウドの公式ドキュメントに委ねられており、一部の内部ベンチマークの元データは完全には公開されておらず、外部のパフォーマンス比較は主にテンセントが発表した指標や指示に基づいています。
FAQ
Q: テンセントHY 2.0とは何ですか?
A: これは騰訊混源の汎用大規模言語モデルの最新世代で、MoEアーキテクチャを用い、総パラメータは406B、活性化は32Bで、推論、コード、長文機能に重点を置いています。
Q: このリリースの具体的なバージョンは何ですか?
A: テキストモデルには主に2種類あります。Tencent HY 2.0 Think(深い推論用)とTencent HY 2.0 Instruct(一般的な対話や執筆用)です。
Q: HY 2.0のコンテキストの長さや入出力仕様は何ですか?
A: ファミリーモデルは最大256Kのコンテキストをサポートすると主張しており、クラウドThink/Instructインターフェースの現在の最大入力は128Kで、そのうちThinkの最大出力は64K、Instructの最大出力は16Kです。
Q: ThinkとInstructの主な違いは何ですか?
A: Thinkは複雑な推論、コード生成、エージェントツール呼び出しなどの「ゆっくり考える」作業により適しています。 Instructは、高い同時進行性と高い応答要件を持つチャット、執筆、ビジネスのQ&Aシナリオにより適しています。
Q: 完全にオープンソースですか?アクセスや利用方法は教えてください。
A: HY 2.0は現在、Tencent Cloud APIという商用サービスを提供しており、一部のTencent製品にも実装されています。