Le dernier Claude Mythos Preview d’Anthropic n’est pas ouvert au public au rythme des grands modèles conventionnels, mais est d’abord intégré dans des scénarios de recherche en cybersécurité défensive. La raison est simple : les capacités du modèle en matière de découverte de vulnérabilités zero-day, de génération de chaînes et d’analyse inverse ont contraint les grandes entreprises de modèles à parler d’abord des limites de sécurité, puis de l’expansion du produit.
Mythos Preview a d’abord été placé dans le bac à sable sécurisé
Anthropic a annoncé le 7 avril que Claude Mythos Preview est un modèle de langage polyvalent, mais que ses capacités les plus marquantes concernent les tâches de cybersécurité, en particulier le développement de minage et d’exploitation des vulnérabilités. Le projet Glasswing, lancé en même temps, a d’abord transmis le modèle à des partenaires clés de l’industrie et à des développeurs open source.
Cela signifie qu’au lieu de traiter Mythos Preview comme une itération normale du modèle, Anthropic le considère comme une nouvelle variable qui pourrait changer l’équilibre entre attaque et défense. La méthode d’accès n’est pas un appel ouvert, mais une prévisualisation de recherche verrouillée sur invitation uniquement, et le signal de libération est clair : la capacité a atteint un point critique, et la propagation doit d’abord être contrôlée.
Le minage de vulnérabilités zero-day est entré dans la période d’accélération de l’IA
Anthropic a révélé que Mythos Preview avait pu détecter et exploiter des vulnérabilités zero-day dans les systèmes d’exploitation et navigateurs grand public lors des tests, et a même découvert une vulnérabilité OpenBSD qui existait depuis 27 ans. Plus sensiblement, l’équipe a indiqué que le modèle peut également relier plusieurs vulnérabilités en une chaîne d’attaque complète, incluant l’évasion en mode navigateur en boîte à sable et l’exécution à distance du code.
D’après les benchmarks, ce saut n’est pas une correction mineure. Auparavant, Opus 4.6 avait un taux de réussite quasi nul dans le développement d’exploits autonomes, tandis que Mythos Preview a pu générer des exploits exécutables à plusieurs reprises lors d’expériences similaires. L’amélioration des capacités du modèle ne consiste plus seulement à « mieux écrire du code », mais commence à s’intégrer en partie au processus réel des chercheurs en sécurité.
Les produits de sécurité de l’IA sont en cours de redéfinition
Ce qui mérite le plus la vigilance de l’industrie n’est pas de savoir si le modèle détectera des bugs, mais qu’il abaisse le seuil. Anthropic affirme franchement que les ingénieurs sans formation formelle en sécurité peuvent également obtenir des exploits disponibles de vulnérabilités d’exécution de code à distance du jour au lendemain grâce à Mythos Preview. Cela réécrit le profil utilisateur de l’outil de sécurité.
C’est aussi un changement direct dans la chaîne industrielle de l’IA. Par le passé, lorsque nous parlions d’IA pour la sécurité, nous nous concentrions davantage sur la classification des alarmes, l’analyse des journaux et la réparation automatique. Désormais, le modèle de pointe commence à couvrir toute la chaîne de « découverte des vulnérabilités, vérification des problèmes, génération et utilisation », et la pression sur la valeur commerciale et la gouvernance des grands modèles de sécurité ont été accrues en même temps.
Le jugement industriel derrière le projet Glasswing
La liste des partenaires de Project Glasswing comprend Amazon Web Services, Apple, Cisco, CrowdStrike, Google, Microsoft, NVIDIA, Palo Alto Networks et la Linux Foundation, entre autres. Anthropic souhaite clairement confier ce modèle aux défenseurs en premier, en patchant les infrastructures logicielles critiques avant une gamme plus large de capacités similaires avant qu’elle ne déborde de ses capacités.
Cela reflète également un jugement plus réaliste : l’IA générative passe des outils d’amélioration de l’efficacité au bureau à des infrastructures professionnelles à haut risque. Quiconque parvient à intégrer le modèle dans la gouvernance des vulnérabilités, la validation des correctifs, l’audit du code et les processus de renforcement de la chaîne d’approvisionnement aura plus de chances d’avoir son mot à dire sur la prochaine vague du marché de la sécurité IA.
Lorsque la grande compétition de modèles miniatures atteint ce stade, les critères de jugement ne se limitent plus à la liste des scores et à la vitesse de raisonnement. La sécurité de l’IA devient l’un des champs de bataille les plus sensibles et les plus commerciaux pour les modèles de pointe, et Mythos Preview met cela sur la table à l’avance.