Perplexityは、実際のウェブ環境におけるAIブラウザのセキュリティ強化を目的としたBrowseSafeシステムとその伴うベンチマークであるBrowseSafe-Benchのリリースを発表しました。 このソリューションはCometブラウザのシナリオを対象としており、その核心はウェブページ内の悪意ある自然言語命令を特化して検出するモデルであり、リアルタイムで全ページのHTMLを遅延を大幅に増加させることなくスキャンし、エージェントに対するプロンプトインジェクション攻撃を識別できるものです。
記事によると、BrowseSafe-Benchには14,000以上の本番環境に適したウェブページサンプルが含まれており、11種類の攻撃ターゲット、9つの注入場所、複数の言語や表現スタイルをカバーしており、複雑でノイズの多いページで異なる防御戦略の性能を評価するためのものです。 Perplexityはブラウザを「タスクをプロキシする作業環境」として扱い、ウェブページ、メール、ファイルのすべてのコンテンツを信頼できない入力として扱い、「深層防御」戦略とコンテンツスキャン、最小権限ツール呼び出し、機密操作の二次確認を組み合わせることで、モデルが隠れた指示に乗っ取られるリスクを減らします。
同社は、BrowseSafeとベンチマークがオープンソース形式で提供されており、開発者が自作したブラウジングエージェントのセキュリティ強化を一から構築することなく、ローカルで検出モデルを実行できると述べています。 評価結果は、直接的および明示的な攻撃は比較的傍受されやすく、多言語や隠れた指示は間接的かつ仮説的なトーンで行われる場合、より混乱を招くことを示しています。これにより、これらの弱点に対する継続的な訓練と反復が今後も必要であることが示唆されています。
よくある質問
Q: ブラウズセーフとは何ですか?
A: BrowseSafeは、ウェブページ内の悪意ある指示を検出することに焦点を当てたモデルで、AIブラウザでリアルタイムでプロンプトインジェクション攻撃を特定するために使われます。
Q: BrowseSafe-Benchは何をするのですか?
A: これは、プロンプトインジェクション防御の効果を評価・向上させるために、14,000以上のウェブページサンプルを公開したベンチマークです。
Q: このプログラムは主にどのような種類のセキュリティ脅威に対応していますか?
A: 主にコメント、テンプレート、フッター、その他のウェブページの場所に隠された悪意のあるテキスト指示を標的にし、AIエージェントの乗っ取りを防ぐことを目的としています。
Q: Perplexityはブラウザでどのように「ディフェンス深度」を実装しているのですか?
A: これは、信頼できないすべてのコンテンツを事前スキャンし、ツールの権限を制限し、ユーザーに機密操作の確認を求めることで効果を発揮します。
Q: 開発者はどのようにBrowseSafeを利用できますか?
A: 開発者はオープンソースの検出モデルやベンチマークを直接呼び出し、ローカルで自社のプロキシシステムに統合し、ページコンテンツを自動スキャン・評価できます。