美団のLongCatチームは「LongCat-Flash-Thinking-2601」をリリース・リリースしました。これは「深く一般的なエージェント思考」のためのバージョンとして位置づけられ、エージェント検索、エージェントツールの使用、ツール統合推論などのタスクで高得点を得ることに重点を置き、ランダムおよび複雑なタスクにおいてより強力な一般化能力を持つと主張しています。 このバージョンではウェブトライアルとAPIアクセスが提供されており、関連資料はHugging FaceとGitHubで同時に公開されています。
モデル導入では3つのルートが強調されています。第一に、多環境拡張と多環境強化学習(DORAインフラ拡張に基づく)を通じてエージェントの能力を向上させること; 第二に、「混沌と不確実」な実在シナリオに対する堅牢性を高めるためのノイズ分析とコースベースのトレーニングの導入; 三つ目は「ヘビーシンキングモード」を起動することで、並列思考で道の幅を広げ、その後サマリーモデルの出力を統合し、反復的推論ループをサポートします。 また、チームは「ジグザグ・アティショナル(LoZA)」を通じて約100万トークンのコンテキスト機能を促進すると発表しましたが、具体的なローンチ時期や入手可能性についてはさらに説明が必要です。

よくある質問
Q: LongCat-Flash-Thinking-2601とは何ですか?
A: これはLongCat-Flash-Thinkingシリーズの更新版で、エージェント思考、ツール使用、複雑なタスクの一般化強化に焦点を当てています。
Q: LongCat-Flash-Thinking-2601の無料トライアルはどこで受けられますか?
A: 公式は会話体験のためのウェブポータルを提供しており、このバージョンではAPIアクセスも提供されていると説明しています。
Q: ヘビーシンキングモードは具体的に何をするのですか?
A: 複数の独立した推論トラックを並行して探求し、その後要約モデルで回答を統合し、推論を深めるためにサイクルで反復を行うことができます。
Q: 1Mトークンのコンテキストはすでにオープンですか?
A: 公式声明は「来る」とされており、これはジグザグ・アテンション(LoZA)に関連していますが、具体的な着陸位置はまだ不明です。
Q: このモデルは「ネットワークセキュリティにおいて最も強力なモデル」としてどのように理解すべきでしょうか?
A: コードベースのリスクポイントや脆弱性の手がかりの理解とローカライズ能力を記述する傾向があり、実際の効果はデータ、テスト、セキュリティプロセスの協力に依存します。