Zurück zu KI-Informationen
Perplexity bringt BrowseSafe und BrowseSafe-Bench heraus, um die KI-Browsing-Sicherheit zu verbessern

Perplexity bringt BrowseSafe und BrowseSafe-Bench heraus, um die KI-Browsing-Sicherheit zu verbessern

KI-Informationen Admin 105 Aufrufe

Perplexity kündigte die Einführung des BrowseSafe-Systems und seines begleitenden Benchmarks BrowseSafe-Bench an, um die Sicherheit von KI-Browsern in realen Webumgebungen zu verbessern. Die Lösung richtet sich an das Comet-Browser-Szenario und ist im Kern ein Modell, das speziell bösartige natürliche Sprachanweisungen auf Webseiten erkennt, die ganzseitiges HTML in Echtzeit scannen können, ohne die Latenz erheblich zu erhöhen, um Prompt-Injection-Angriffe gegen Agenten zu erkennen. Laut

dem Artikel enthält BrowseSafe-Bench mehr als 14.000 produktionsfreundliche Webseitenbeispiele, die 11 Arten von Angriffszielen, 9 Injektionsorten sowie mehrere Sprachen und Ausdrucksstile abdecken, um die Leistung verschiedener Verteidigungsstrategien auf komplexen, rautreichen Seiten zu bewerten. Perplexity behandelt den Browser als eine "Arbeitsumgebung, die Aufgaben proxyiert", behandelt alle Inhalte von Webseiten, E-Mails und Dateien als nicht vertrauenswürdige Eingaben und reduziert das Risiko, dass das Modell durch versteckte Anweisungen durch eine "Defense in Depth"-Strategie gekapert wird, kombiniert mit Inhaltsscanning, Least-Privileg-Tool-Aufrufen und sekundärer Bestätigung sensibler Operationen.

Das Unternehmen erklärte, dass BrowseSafe und der Benchmark als Open-Source bereitgestellt werden, sodass Entwickler lokal Erkennungsmodelle ausführen können, um selbst erstellte Browseragenten zu stresstesten und die Sicherheitshärtung zu sichern, ohne ein Schutzrahmen von Grund auf neu zu erstellen. Die Bewertungsergebnisse zeigen, dass direkte und explizite Angriffe relativ leicht abzufangen sind und mehrsprachige oder versteckte Anweisungen in indirektem, hypothetischem Ton verwirrender sind, was darauf hindeutet, dass kontinuierliches Training und Iteration dieser Schwächen auch in Zukunft notwendig sind.

FAQs

F: Was ist BrowseSafe?

A: BrowseSafe ist ein Modell, das sich darauf konzentriert, bösartige Anweisungen auf Webseiten zu erkennen und zur Echtzeit-Erkennung von Prompt-Injection-Angriffen in KI-Browsern eingesetzt wird.

F: Was macht BrowseSafe-Bench?

A: Es handelt sich um einen öffentlichen Benchmark von mehr als 14.000 Webseitenproben, um die Wirksamkeit von Prompt-Injektions-Abwehrmechanismen zu bewerten und zu verbessern.

F: Welche Arten von Sicherheitsbedrohungen adressiert das Programm hauptsächlich?

A: Es richtet sich hauptsächlich gegen bösartige Textanweisungen, die in Kommentaren, Vorlagen, Fußzeilen und anderen Stellen auf Webseiten versteckt sind, um zu verhindern, dass sie KI-Agenten kapern.

F: Wie implementiert Perplexity die "Tiefenverteidigung" im Browser?

A: Sie tritt in Kraft, indem alle nicht vertrauenswürdigen Inhalte vorab gescannt werden, Werkzeugberechtigungen eingeschränkt werden und Nutzer sensible Operationen bestätigen müssen.

F: Wie können Entwickler BrowseSafe nutzen?

A: Entwickler können Open-Source-Erkennungsmodelle und Benchmarks direkt aufrufen, diese lokal in ihre eigenen Proxy-Systeme integrieren und Seiteninhalte automatisch scannen und bewerten.

BrowseSafe-Browser fordert Injektionsschutz an PerplexityCometAI Browsing-Sicherheitsmechanismen BrowseSafeBench fordert den Injektions-Benchmark aus KI-Browser-Web-Erkennung von bösartigen Anweisungen Verteidige dich gegen versteckte Cue-Injection-Angriffe auf Webseiten Mehrsprachige Prompts werden in offensive und defensive Sicherheitspraktiken integriert Sicherheitsrisiken von KI-Agenten in echten Netzwerken Der vollständige HTML-Scan erkennt bösartige natürliche Sprache Der Browser-Agent setzt Umweltschutzrichtlinien durch Tips bringen verteidigungstiefe, mehrschichtige Architekturen ein Bösartiges Anweisungserkennungsschema im Kommentarbereich der Webseite Erkennung versteckter Angriffsaussagen in der Footer-Vorlage KI-Browsing-Agenten-Least-Privilege-Tool-Aufruf Sensible Operation sekundäre Bestätigung zur Verhinderung von Übergriffen BrowseSafe Open-Source-Prompt-Injection-Erkennungsmodell BrowseSafeBench 14.000 Webbeispiele Produktionsfreundliche Prompt-Injektionstestsets Multiple Injektionsstellen und Ausdrucksstilbewertungen KI durchsucht Sicherheitsbenchmarks zur Bewertung von Verteidigungsstrategien Der Browser behandelt die Webmail-Datei als unzuverlässig Ein praktischer Leitfaden zum Aufbau eines sicheren KI-Browsing-Agenten Schwierigkeitsanalyse der mehrsprachigen impliziten Prompt-Injektionserkennung Browser-Prompts werden in die offensive und defensive Open-Source-Toolchain eingefügt Führe den Stresstest des BrowseSafe-Modells lokal aus Integrierter Surfsicherheitsschutz für selbstgebaute KI-Agenten Bösartige Befehlsidentifikation auf komplexen Rauschseiten Vergleich der direkten und indirekten Abfangeffekte Wie KI-Browser vermeiden können, von versteckten Anweisungen gekapert zu werden Auswirkungen von Prompt-Injection-Angriffen auf die Aufgaben von KI-Agenten Best Practices für LLM-Sicherheit in Browserszenarien PerplexityComet durchsucht die Analyse der Proxy-Sicherheitsarchitektur Auswirkungen des Prompt-Injection-Schutzes auf die KI-Sucherfahrung Sehen Sie sich Branchensicherheitstrends bei BrowseSafe Open Source an Setze im Browser die geringste Berechtigung für Toolaufrufe Das Sicherheitsdesign sensibler Operationen erfordert eine sekundäre Bestätigung durch den Benutzer BrowseSafeBench wird verwendet, um verschiedene Verteidigungsstrategien zu bewerten Die Verteidigung gegen die Spitzeninjektion erfordert kontinuierliches Training und Iteration Baue einen sicheren und zuverlässigen KI-Webbrowser-Assistenten Wie Entwickler BrowseSafe-Erkennung lokal integrieren können Filterung bösartiger Aussagen für Kommentarbereiche und Footer Der KI-Browser behält die Null-Vertrauens-Prinzipien für unbekannte Webseiten fest Das BrowseSafe-Modell hat nur minimale Auswirkungen auf die Latenz Prompt-Injection-Angriffsbeispiele decken mehrere Sprachen und Szenarien ab Eine Sicherheitsbasis, wenn KI-Agenten das reale Web durchsuchen. Verwenden Sie BrowseSafe für interne Wissensdatenbank-Verlinkungen Sicherheitsherausforderungen für Agenten, die Postfächer und Dateiinhalte durchsuchen Prompt-Injection-Schutz und Datenschutz-Compliance werden gemeinsam betrachtet KI-Browser-Sicherheitsbewertung und Red-Teaming-Prozess In Kombination mit BrowseSafe und Sandbox-Isolation gibt es mehrere Schutzmaßnahmen Prompt-Injection-Angriffsschutz im Produktdesign

Empfohlene Tools

Mehr