推荐 11.5
Conf: 50%
本文研究了在池化工具(Pool-of-Tools)赋能的 LLM agent 中存在的跨工具资源窃取和污染攻击。作者提出了一种名为“Les Dissonances”的攻击框架,利用 LLM agent 在工具选择与调用过程中的语义不匹配和安全漏洞,实现恶意工具对系统内其他工具的干扰和控制。具体攻击向量包括:通过注入伪装成合法工具的恶意工具来劫持 agent 的决策流程;利用工具间的数据依赖关系进行信息窃取;以及通过操纵工具输出污染 agent 的后续推理。作者设计并实现了一个 Chord agent 和测试 agent 来演示攻击效果,并在多种 LLM 代理场景中验证了攻击的可行性和严重性。实验结果表明,攻击者可以成功窃取敏感数据、篡改工具行为,甚至导致 agent 执行恶意操作。该工作揭示了当前 LLM agent 工具集成机制中的安全盲区,为构建安全可靠的 agent 系统提供了重要警示。适合 LLM 安全研究员、AI 系统开发者以及关注 agent 安全的蓝队人员阅读。
💡 推荐理由: 该研究首次系统性地分析了 LLM agent 在工具池场景下的跨工具安全风险,揭示了现有工具编排机制中的语义漏洞,对保障下一代 AI agent 系统的安全性具有重要警示意义。
🎯 建议动作: 研究跟进
排序因子: 来自网络安全顶级会议 (+8) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)