#web-agents 主题 - Cyber Security Daily Radar

👥 作者: Zihao Wang, Yiming Li, Yutong Wu, Zheyu Liu, Kangjie Chen, Fok Kar Wai, Pin-Yu Chen, Vrizlynn L. L. Thing, Bo Li, Dacheng Tao, Tianwei Zhang

大型语言模型驱动的Web代理（Web Agent）正越来越多地被部署在真实环境中，它们需要处理不可信的网页内容并执行具有直接后果的操作，因此容易受到提示注入攻击——看似良性的内容中嵌入对抗性指令以操纵代理行为。现有的安全基准采用“攻击中心”视角，仅关注注入的技术可行性，而忽略了危害在不同利益相关者之间的不对称分布。实际上，同一次攻击可能对用户、卖家、平台等不同实体产生截然不同的后果，且同一攻击模式对不同目标的有效性也可能显著不同。为捕捉这些特性，本文提出**SBC**（Stakeholder-Centric Benchmark），一个以利益相关者为中心的基准，系统性地对真实Web代理系统中的危害进行分类和归因。SBC区分受影响的实体（如用户、卖家、平台），将攻击分解为具体目标（如信息窃取、任务劫持、信誉损害等），并采用互补的结果级和过程级度量进行评估。实验结果显示，当前的主流代理无法可靠地抵御任何单一攻击目标，且失败模式呈现多样化的定性差异：包括“隐蔽寄生”（攻击成功但不干扰用户委托任务）、“错位干扰”（任务被中断但攻击未成功）和“复合失败”（对抗目标与任务完整性同时被违反）。这些模式在传统评估中被完全忽略。本文的工作强调了在真实部署中采用利益相关者感知评估的必要性，为LLM基代理的安全性研究提供了新的视角和工具。该基准已开源（https://github.com/StakeBench/SBC）。

💡 推荐理由: 该研究揭示了提示注入攻击对Web代理不同利益相关者的影响差异，提供了一个结构化的危害归因框架。安全从业者可借此评估自身系统在复杂多角色场景下的真实风险，避免传统单维度评估的盲区，从而设计更有针对性的防御策略。

🎯 建议动作: 研究跟进：阅读论文并下载基准框架，评估自身Web代理系统在用户、卖家、平台等不同视角下的提示注入脆弱性，重点关注隐蔽寄生和错位干扰等非传统失败模式。

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

#web-agents

Who Pays the Price? Stakeholder-Centric Prompt Injection Benchmarking for Real-world Web Agents