Z.ai mise à jour publie GLM-4.7 et le positionne comme le nouveau modèle de base phare. Selon les informations officielles, GLM-4.7 a considérablement amélioré ses capacités de programmation, un raisonnement complexe et l’utilisation des outils par rapport à GLM-4.6, et a également été amélioré dans des situations telles que le chat, l’écriture créative et le jeu de rôle ; Les poids des modèles sont disponibles publiquement dans Hugging Face et ModelScope, et peuvent être expérimentés directement dans chat.z.ai.
Du côté des capacités, GLM-4.7 met l’accent sur la stabilité pour le « codage d’agents » et les « tâches à long lien » : introduisant un mécanisme de contrôle de la pensée plus granulaire, incluant l’inférence avant d’appeler les outils, et conservant le contenu d’inférence lors de plusieurs tours de conversation afin de réduire la perte d’information, améliorant ainsi la cohérence de l’exécution en plusieurs étapes. En ce qui concerne les indicateurs de référence, l’officiel liste un certain nombre de données comparatives telles que SWE-bench Verified, SWE-bench Multilingual et Terminal Bench 2.0 dans la carte modèle, et la décrit comme atteignant le niveau de tête du camp open source.
GLM-4.7 a été progressivement remplacé comme modèle par défaut du plan de codage GLM, fournissant des conseils d’accès pour les chaînes d’outils de codage courantes. La page d’abonnement indique que le forfait commence à 3 $/mois. Puisque différentes régions, comptes et configurations d’outils peuvent influencer les modèles disponibles et les effets d’expérience, les utilisateurs doivent toujours prêter attention aux quotas, aux méthodes d’appel et aux coûts locaux de puissance de calcul.
FAQ
Q : Quel modèle de produit est le GLM-4.7 ?
R : La version phare grand modèle publiée par Z.ai se concentre sur la programmation, le raisonnement complexe et l’appel d’outils, et offre des poids ouverts et une expérience en ligne.
Q : Quelles sont les principales améliorations entre le GLM-4.7 et le GLM-4.6 ?
R : L’officiel met l’accent sur les capacités de codage, le raisonnement complexe et la stabilité de l’exécution de la chaîne d’outils, tout en améliorant les performances des discussions et des scénarios créatifs.
Q : Le GLM-4.7 peut-il être déployé localement ?
R : Oui, le responsable propose un canal de téléchargement ouvert et donne des instructions de déploiement selon le cadre de raisonnement principal, mais la puissance de calcul et la pression sur les coûts sont plus grandes.
Q : Quelle est la relation entre le plan de codage GLM et GLM-4.7 ?
R : GLM-4.7 est déjà l’un des modèles par défaut pour ce forfait d’abonnement, fournissant des conseils d’accès et de configuration pour divers outils de codage.
Q : Quel problème le mécanisme de « pensée réservée » du GLM-4.7 résout-il ?
R : Il est utilisé pour réduire l’incohérence entre la perte d’inférence et l’incohérence dans les tâches multi-tours, et améliorer la contrôlabilité et le taux d’accomplissement des tâches proxy à long link.