推荐 11.5
Conf: 50%
本文提出了一种针对多源数据LLM应用的新型提示注入攻击方法ObliInjection。在现实场景中,LLM的输入数据往往来自多个不同来源,每个来源贡献一个输入段,攻击者仅能控制其中部分段,且通常不知道各段在输入中的排列顺序。现有的提示注入攻击要么假设整个输入数据来自单一攻击者控制的来源,要么忽略多源数据中段顺序的不确定性,因此在多源场景下成功率有限。ObliInjection通过两项关键技术创新解决这一挑战:一是“顺序无关损失”(order-oblivious loss),该损失函数量化了无论干净段和污染段如何排列,LLM完成攻击者选定任务的可能性;二是“顺序GCG算法”(orderGCG),专门设计用于最小化顺序无关损失并优化污染段的内容。实验涵盖了三个不同应用领域的数据集和十二种LLM,结果表明即使只污染输入中6-100个段中的一个,ObliInjection也能高效实施攻击。论文提供了代码和数据开源链接。本研究揭示了多源数据LLM应用中一个被忽视的安全漏洞,对LLM安全防护具有重要参考价值。
💡 推荐理由: 提示注入是LLM安全的核心威胁之一,而多源数据场景普遍存在于各类LLM Agent和工具链中。ObliInjection首次系统地研究了段顺序不确定下的注入攻击,该攻击隐蔽性强且成功率较高,对依赖多源输入的LLM应用构成实际风险。
🎯 建议动作: 研究跟进
排序因子: 来自网络安全顶级会议 (+8) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)