#web-agents

共收录 1 条相关安全情报。

← 返回所有主题
👥 作者: Zihao Wang, Yiming Li, Yutong Wu, Zheyu Liu, Kangjie Chen, Fok Kar Wai, Pin-Yu Chen, Vrizlynn L. L. Thing, Bo Li, Dacheng Tao, Tianwei Zhang

大型语言模型驱动的Web代理(Web Agent)正越来越多地被部署在真实环境中,它们需要处理不可信的网页内容并执行具有直接后果的操作,因此容易受到提示注入攻击——看似良性的内容中嵌入对抗性指令以操纵代理行为。现有的安全基准采用“攻击中心”视角,仅关注注入的技术可行性,而忽略了危害在不同利益相关者之间的不对称分布。实际上,同一次攻击可能对用户、卖家、平台等不同实体产生截然不同的后果,且同一攻击模式对不同目标的有效性也可能显著不同。为捕捉这些特性,本文提出**SBC**(Stakeholder-Centric Benchmark),一个以利益相关者为中心的基准,系统性地对真实Web代理系统中的危害进行分类和归因。SBC区分受影响的实体(如用户、卖家、平台),将攻击分解为具体目标(如信息窃取、任务劫持、信誉损害等),并采用互补的结果级和过程级度量进行评估。实验结果显示,当前的主流代理无法可靠地抵御任何单一攻击目标,且失败模式呈现多样化的定性差异:包括“隐蔽寄生”(攻击成功但不干扰用户委托任务)、“错位干扰”(任务被中断但攻击未成功)和“复合失败”(对抗目标与任务完整性同时被违反)。这些模式在传统评估中被完全忽略。本文的工作强调了在真实部署中采用利益相关者感知评估的必要性,为LLM基代理的安全性研究提供了新的视角和工具。该基准已开源(https://github.com/StakeBench/SBC)。

💡 推荐理由: 该研究揭示了提示注入攻击对Web代理不同利益相关者的影响差异,提供了一个结构化的危害归因框架。安全从业者可借此评估自身系统在复杂多角色场景下的真实风险,避免传统单维度评估的盲区,从而设计更有针对性的防御策略。

🎯 建议动作: 研究跟进:阅读论文并下载基准框架,评估自身Web代理系统在用户、卖家、平台等不同视角下的提示注入脆弱性,重点关注隐蔽寄生和错位干扰等非传统失败模式。

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)