返回AI资讯
Perplexity 发布 BrowseSafe 与 BrowseSafe-Bench 强化 AI 浏览安全防护

Perplexity 发布 BrowseSafe 与 BrowseSafe-Bench 强化 AI 浏览安全防护

AI资讯 Admin 105 次浏览

Perplexity 宣布推出 BrowseSafe 系统及配套基准 BrowseSafe-Bench,用于提升 AI 浏览器在真实网络环境中的安全性。该方案面向其 Comet 浏览器场景,核心是一套专门检测网页中恶意自然语言指令的模型,可在不显著增加延迟的前提下实时扫描整页 HTML,识别针对代理的提示注入攻击。

文章介绍,BrowseSafe-Bench 收录 1.4 万余个贴近生产环境的网页样本,涵盖 11 类攻击目标、9 种注入位置以及多种语言与表述风格,用于评估不同防御策略在复杂、噪声丰富页面上的表现。Perplexity 将浏览器视为“代理执行任务的工作环境”,把来自网页、邮件和文件等内容全部视作不可信输入,并通过“防御纵深”策略,结合内容扫描、最小权限工具调用和敏感操作二次确认,降低模型被隐藏指令劫持的风险。

公司表示,BrowseSafe 及基准均以开源方式提供,开发者可在本地运行检测模型,对自主构建的浏览代理进行压力测试和安全加固,而无需从零搭建防护框架。评测结果显示,直接、显性攻击相对容易拦截,多语言或以间接、假设语气隐藏的指令更具迷惑性,提示后续仍需针对这些弱点持续训练与迭代。

常见问题

Q:BrowseSafe 是什么?

A:BrowseSafe 是一款专注于检测网页中恶意指令的模型,用于在 AI 浏览器中实时识别提示注入攻击。

Q:BrowseSafe-Bench 有什么作用?

A:它是包含 1.4 万余个网页样本的公开基准,用于评估与改进提示注入防御效果。

Q:该方案主要应对哪类安全威胁?

A:主要针对网页中隐藏在评论、模板、页脚等位置的恶意文本指令,防止其劫持 AI 代理行为。

Q:Perplexity 如何在浏览器中实现“防御纵深”?

A:通过对所有不可信内容做预扫描、限制工具权限,并对敏感操作要求用户确认等多层措施共同生效。

Q:开发者如何使用 BrowseSafe?

A:开发者可直接调用开源检测模型与基准,在本地集成到自身代理系统中,对页面内容进行自动化安全扫描和评估。

BrowseSafe浏览器提示注入防护 PerplexityCometAI浏览安全机制 BrowseSafeBench提示注入基准 AI浏览器网页恶意指令检测 防御网页中隐藏提示注入攻击 多语言提示注入攻防安全实践 AI代理在真实网络中的安全风险 HTML整页扫描检测恶意自然语言 浏览器代理执行环境防护策略 提示注入防御纵深多层架构 网页评论区恶意指令识别方案 页脚模板中隐藏攻击语句检测 AI浏览代理最小权限工具调用 敏感操作二次确认防止越权 BrowseSafe开源提示注入检测模型 BrowseSafeBench一万四千网页样本 贴近生产环境的提示注入测试集 多种注入位置和表述风格评估 AI浏览安全基准对防御策略评测 浏览器将网页邮件文件视为不可信 构建安全AI浏览代理的实战指南 多语言隐性提示注入检测难点分析 浏览器提示注入攻防开源工具链 在本地运行BrowseSafe模型压力测试 为自建AI代理集成浏览安全防护 复杂噪声网页中的恶意指令识别 直接攻击与间接攻击拦截效果对比 AI浏览器如何避免被隐藏指令劫持 提示注入攻击对AI代理任务影响 浏览器场景下的LLM安全最佳实践 PerplexityComet浏览代理安全架构解析 提示注入防护对AI搜索体验影响 从BrowseSafe开源看行业安全趋势 浏览器中对工具调用设置最小权限 敏感操作需用户二次确认的安全设计 BrowseSafeBench用于评测多种防御策略 提示注入防御需要持续训练与迭代 构建安全可靠的AI网页浏览助手 开发者如何在本地集成BrowseSafe检测 针对评论区和页脚的恶意语句过滤 AI浏览器对未知网页保持零信任原则 BrowseSafe模型对延迟影响微乎其微 提示注入攻击样本覆盖多语言多场景 AI代理浏览真实网络时的安全基线 将BrowseSafe用于企业内部知识库链接 代理浏览邮箱和文件内容的安全挑战 提示注入防护与隐私合规共同考量 AI浏览器安全评估与红队测试流程 结合BrowseSafe和沙箱隔离多重防护 提示注入攻击防护在产品设计中的落地

推荐工具

更多