Retour à Informations sur l’IA
Anthropic lance Claude Sonnet 4.5 : se présentant comme le « meilleur modèle d'encodage au monde », il améliore les opérations des agents et des PC.

Anthropic lance Claude Sonnet 4.5 : se présentant comme le « meilleur modèle d'encodage au monde », il améliore les opérations des agents et des PC.

Informations sur l’IA Admin 64 vues

Anthropic a lancé son modèle de nouvelle génération , Claude Sonnet 4.5 , officiellement présenté comme le « meilleur modèle de codage au monde », ouvrant la voie à la création d'agents intelligents complexes et d'opérations informatiques, et apportant des améliorations significatives au raisonnement et aux évaluations mathématiques. Plusieurs médias et partenaires ont révélé que Sonnet 4.5 pouvait fonctionner de manière autonome pendant environ 30 heures dans des tâches d'ingénierie concrètes, soit une amélioration significative par rapport à son prédécesseur, et affichait également d'excellentes performances lors de tests de performance tels que SWE-Bench.

Côté écosystème, Sonnet 4.5 est en cours de déploiement auprès des entreprises et des outils de développement. Intégré aux canaux bêta publics AWS Bedrock et GitHub Copilot , il offre la sélection de modèles dans des interfaces telles que Claude Code et les IDE/CLI. Les responsables affirment également que sa sécurité et ses capacités de résistance aux attaques ont été renforcées, visant une utilisation stable à long terme en environnements de production.

Questions fréquemment posées

Q : Quelle est l’attraction principale de Claude Sonnet 4.5 ?

A : Ciblant le codage au niveau de la production et les agents complexes, il met l'accent sur l'orchestration d'outils « informatiques » et l'exécution autonome à long terme, et améliore le raisonnement/les performances mathématiques.

Q : Existe-t-il des données empiriques ?

R : Les rapports officiels et médiatiques mentionnent qu'il peut coder de manière indépendante en continu pendant environ 30 heures et établir de nouveaux scores sur des benchmarks tels que SWE-Bench.

Q : Où puis-je l'utiliser ?

R : Il a été lancé sur les propres produits d'Anthropic et est entré dans la version bêta publique et l'intégration d' AWS Bedrock et de GitHub Copilot .

Q : Quelles sont les améliorations par rapport à la génération précédente ?

A : Le fonctionnement autonome à long terme a été augmenté d'environ 7 heures à environ 30 heures, et l'appel d'outils, le fonctionnement de l'ordinateur et l'anti-robustesse ont été simultanément renforcés.

Q : À quels scénarios convient-il ?

A : Maintenance de bases de code volumineuses, création d'applications de bout en bout, traitement de données complexes et agents automatisés au niveau de l'entreprise.

Outils Recommandés

Plus