Retour à Informations sur l’IA
Perplexity publie BrowseSafe et BrowseSafe-Bench pour renforcer la sécurité de navigation par IA

Perplexity publie BrowseSafe et BrowseSafe-Bench pour renforcer la sécurité de navigation par IA

Informations sur l’IA Admin 104 vues

Perplexity a annoncé le lancement du système BrowseSafe et de son benchmark compagnon, BrowseSafe-Bench, afin d’améliorer la sécurité des navigateurs d’IA dans des environnements web réels. La solution s’adresse à son scénario de navigateur Comète, et au fond, c’est un modèle qui détecte spécifiquement les instructions en langage naturel malveillant dans les pages web, ce qui peut analyser en temps réel du HTML pleine page sans augmenter significativement la latence pour identifier les attaques par injection de prompt contre les agents. Selon

l’article, BrowseSafe-Bench contient plus de 14 000 exemples de pages web adaptées à la production, couvrant 11 types de cibles d’attaque, 9 emplacements d’injection, ainsi que plusieurs langages et styles d’expression, afin d’évaluer la performance de différentes stratégies de défense sur des pages complexes et riches en bruit. Perplexity considère le navigateur comme un « environnement de travail qui proxie les tâches », traite tout le contenu provenant de pages web, d’emails et de fichiers comme une entrée non fiable, et réduit le risque que le modèle soit détourné par des instructions cachées grâce à une stratégie de « défense en profondeur », combinée à la numérisation du contenu, aux appels aux outils de moindre privilège et à la confirmation secondaire des opérations sensibles.

L’entreprise a indiqué que BrowseSafe et le benchmark sont fournis de manière open source, permettant aux développeurs d’exécuter localement des modèles de détection pour tester la sécurité et renforcer la sécurité des agents de navigation eux-mêmes sans construire un cadre de protection à partir de zéro. Les résultats de l’évaluation montrent que les attaques directes et explicites sont relativement faciles à intercepter, et que les instructions multilingues ou cachées sur un ton indirect et hypothétique sont plus confuses, suggérant qu’un entraînement continu et une itération pour ces faiblesses restent nécessaires à l’avenir.

FAQ

Q : Qu’est-ce que BrowseSafe ?

R : BrowseSafe est un modèle qui se concentre sur la détection d’instructions malveillantes dans les pages web et est utilisé pour identifier les attaques par injection prompte en temps réel dans les navigateurs d’IA.

Q : Que fait BrowseSafe-Bench ?

R : Il s’agit d’un repère public de plus de 14 000 échantillons de pages web visant à évaluer et améliorer l’efficacité des défenses par injection rapide.

Q : Quels types de menaces à la sécurité le programme traite-t-il principalement ?

R : Il cible principalement des instructions textuelles malveillantes cachées dans les commentaires, modèles, pieds de page et autres endroits sur les pages web afin d’empêcher qu’ils ne détournent les agents IA.

Q : Comment Perplexity implémente-t-elle la « profondeur de défense » dans le navigateur ?

R : Il s’applique en pré-analysant tout contenu non fiable, en limitant les autorisations des outils et en exigeant des utilisateurs de confirmer les opérations sensibles.

Q : Comment les développeurs peuvent-ils utiliser BrowseSafe ?

R : Les développeurs peuvent appeler directement des modèles et benchmarks de détection open source, les intégrer localement dans leurs propres systèmes proxy, et scanner et évaluer automatiquement le contenu des pages.

Invites du navigateur BrowseSafe pour la protection contre l’injection Mécanismes de sécurité de navigation de PerplexityCometAI BrowseSafeBench déclenche le benchmark d’injection Détection d’instructions web malveillantes dans un navigateur IA Défendre contre les attaques d’injection de cues cachées sur les pages web Des consignes multilingues sont intégrées aux pratiques de sécurité offensives et défensives Risques de sécurité des agents d’IA dans de vrais réseaux Le balayage HTML pleine page détecte un langage naturel malveillant L’agent navigateur applique les politiques de protection de l’environnement Les pointes injectent des architectures multicouches profondes à la défense Schéma d’identification d’instructions malveillantes dans la zone des commentaires de la page web Détection cachée d’instruction d’attaque dans le modèle de pied de page Appel d’outil de recherche IA pour les agents de recherche minimale Confirmation secondaire d’opération sensible pour éviter les dépassements Modèle de détection par injection de prompts open source BrowseSafe BrowseSafeBench 14 000 exemples web Ensembles de test d’injection prompt adaptés à la production Emplacements multiples d’injection et évaluations du style d’expression Benchmarks de sécurité de navigation par IA pour évaluer les stratégies de défense Le navigateur considère le fichier webmail comme peu fiable Un guide pratique pour construire un agent de navigation sécurisé par IA Analyse de difficulté multilingue implicite par détection d’injection prompte Les invites du navigateur sont injectées dans la chaîne d’outils open source offensive et défensive Effectuez localement le test de résistance du modèle BrowseSafe Protection de sécurité intégrée pour la navigation pour les agents IA auto-construits Identification d’instructions malveillantes dans des pages web complexes de bruit Comparaison des effets d’interception directe et indirecte Comment les navigateurs IA peuvent éviter d’être détournés par des instructions cachées Impact des attaques par injection prompt sur les tâches des agents IA Meilleures pratiques pour la sécurité des LLM dans les scénarios de navigateur PerplexityComet parcourt l’analyse de l’architecture de sécurité proxy Impact de la protection contre l’injection de prompt sur l’expérience de recherche IA Découvrez les tendances de sécurité du secteur grâce à l’open source BrowseSafe Définir le minimum de permissions sur les appels d’outils dans le navigateur La conception de sécurité des opérations sensibles nécessite une confirmation secondaire par l’utilisateur BrowseSafeBench est utilisé pour évaluer une variété de stratégies défensives La défense contre l’injection de pointe nécessite un entraînement et une itération continus Construisez un assistant de navigation web IA sûr et fiable Comment les développeurs peuvent intégrer la détection BrowseSafe localement Filtrage des déclarations malveillantes pour les sections de commentaires et les pieds de page AI Browser maintient des principes de confiance zéro pour les pages web inconnues Le modèle BrowseSafe a un impact minimal sur la latence Les exemples d’attaque par injection rapide couvrent plusieurs langues et scénarios Une base de sécurité lorsque les agents IA naviguent sur le web réel Utilisez BrowseSafe pour la création de liens internes à la base de connaissances Défis de sécurité pour les agents naviguant dans les boîtes aux lettres et le contenu des fichiers La protection par injection rapide et la conformité à la confidentialité sont prises en compte ensemble Évaluation de la sécurité des navigateurs IA et processus de red teaming Combiné à BrowseSafe et à l’isolation Sandbox, plusieurs protections Protection contre les attaques par injection rapide dans la conception de produits

Outils Recommandés

Plus