#multi-tool-poisoning

共收录 1 条相关安全情报。

← 返回所有主题
👥 作者: Liwei Liu, Tianzhu Han, Zijian Liu, Zishu Dong, Na Ruan

随着大语言模型驱动的智能体快速发展,模型上下文协议(MCP)作为一种连接LLM与外部工具的开源协议,已成为现代智能体生态系统的基础。然而,MCP的广泛应用也带来了新的安全威胁,例如工具投毒攻击(TPA),即利用LLM与服务器之间的交互注入恶意提示。现有的投毒方案通常采用单一工具明文嵌入范式,难以抵御人工审计或自动化检测。当前研究缺乏对多工具投毒的系统分析,即多个工具可被协同利用以分散检测风险。本文提出ShareLock——一种多工具阈值投毒框架,利用Shamir阈值方案实现卓越的隐蔽性和容错性。ShareLock将恶意指令作为看似良性的秘密份额,分布到多个工具描述中,同时实现信息论安全性和抵抗中等审计的攻击鲁棒性。通过在服务器更新期间植入隐蔽重建触发器,聚合的份额可重构隐藏指令,导致系统资产或私有数据的关键泄露。为了评估ShareLock的现实威胁,作者构建了涵盖四种多工具场景的综合基准,并在两个不同的MCP客户端上对主流LLM进行了广泛实验。结果表明,ShareLock在基于工具描述检测方面显著优于现有单工具投毒策略,同时保持了超过90%的平均攻击成功率。

💡 推荐理由: 揭示了一种新型、高隐蔽性的多工具投毒攻击手法,威胁LLM智能体生态安全,促使防御者关注MCP协议层面的风险并开发针对性检测与防护机制。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)