L’équipe LongCat de Meituan a publié et lancé « LongCat-Flash-Thinking-2601 », qui se positionne comme une version pour la « pensée d’agent profonde et générale », axée sur les scores élevés dans des tâches telles que la recherche agentique, l’utilisation d’outils agents et le raisonnement d’intégration d’outils, tout en affirmant posséder de meilleures capacités de généralisation dans les tâches aléatoires et complexes. Cette version a permis un essai web et un accès à l’API, et les documents pertinents sont publiés simultanément sur Hugging Face et GitHub.
L’introduction du modèle met l’accent sur trois voies : premièrement, améliorer les capacités des agents par extension multi-environnements et apprentissage par renforcement multi-environnements (basé sur l’expansion de l’infrastructure DORA) ; deuxièmement, l’introduction de l’analyse du bruit et de la formation en cours pour renforcer la robustesse face à des scénarios réels « chaotiques et incertains » ; Le troisième est de lancer le « mode Heavy Thinking », qui étend l’étendue du chemin grâce à la pensée parallèle, puis synthétise la sortie du modèle de résumé et supporte la boucle de raisonnement itératif. L’équipe a également annoncé qu’elle promeudrait la capacité contextuelle d’environ 1 million de tokens via « Zigzag Attention (LoZA) », mais l’heure de lancement précise et la plage de disponibilité doivent encore être expliquées.

FAQ
Q : Qu’est-ce que le LongCat-Flash-Thinking-2601 ?
R : Il s’agit d’une version mise à jour de la série LongCat-Flash-Thinking, axée sur le renforcement de la pensée des agents, l’utilisation des outils et la généralisation des tâches complexes.
Q : Où puis-je obtenir un essai gratuit de LongCat-Flash-Thinking-2601 ?
R : Le responsable propose un portail web pour l’expérience conversationnelle, et explique que cette version offre également un accès à l’API.
Q : Que fait exactement le mode Pensée Lourde ?
R : Il explore en parallèle à travers plusieurs pistes de raisonnement indépendant, puis intègre les réponses par le modèle résumé, et peut être itéré en cycles pour approfondir le raisonnement.
Q : Le contexte du 1M de jetons est-il déjà ouvert ?
R : La déclaration officielle est « coming in », ce qui concerne l’attention en zigzag (LoZA), et la position d’atterrissage précise reste incertaine.
Q : Comment ce modèle doit-il être compris comme « le plus fort en matière de sécurité réseau » ?
R : Il est plutôt enclin à décrire les capacités de compréhension et de localisation des points de risque de base de code et des indices de vulnérabilité, et l’effet réel dépend toujours de la coopération entre les données, les tests et les processus de sécurité.