推荐 11.5
Conf: 50%
本文针对大型语言模型(LLM)系统中的缓存机制提出了语义缓存投毒攻击。传统的缓存投毒主要针对查询字符串精确匹配,而LLM系统常采用语义缓存来缓存具有相似语义的查询,以提高推理效率并降低成本。作者首次提出语义缓存投毒攻击,攻击者通过构造与合法查询语义相似但包含恶意提示的投毒请求,使得后续正常用户查询命中投毒缓存,从而返回被篡改的响应,可能导致信息泄露、错误响应或拒绝服务。论文设计了多种投毒策略,包括基于嵌入向量的扰动、对抗性样本生成等,并在多个开源LLM和商业API上验证了攻击有效性。实验表明,攻击成功率高达80%以上,且能绕过现有防御措施。为应对该威胁,作者提出了基于输入验证和输出一致性检查的防御框架,包括语义异常检测、缓存命中验证和响应完整性校验。该研究揭示了LLM缓存系统的新攻击面,对AI基础设施安全具有重要意义。
💡 推荐理由: 首次揭示LLM语义缓存的安全风险,攻击可导致大规模响应污染,影响所有使用缓存的AI服务。
🎯 建议动作: 研究跟进
排序因子: 来自网络安全顶级会议 (+8) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)