推荐 5.6
Conf: 50%
本文揭示了现代大语言模型(LLM)服务引擎中检索增强生成(RAG)和非前缀键值(KV)缓存融合机制存在的一类结构性安全漏洞。与以往需要严格线性前缀对齐的KV缓存侧信道攻击不同,本文发现基于分块感知内存调度的微架构机制会无意中泄露连续的“Step-Wave”时序信号。作者在此基础上提出了SpliceLeak,这是首个针对非前缀KV缓存融合的端到端侧信道攻击。SpliceLeak通过两个阶段实现隐私窃取:首先结构性地指纹识别隐藏私有提示的精确长度,然后通过操纵边界碰撞逐token提取精确语义内容。在结合vLLM和LMCache的生产级框架上评估表明,SpliceLeak在有限熵场景下可达100%的提取成功率,攻击仅需每个token约63次请求即可穿透连续批处理噪声。为缓解该漏洞,作者提出了SpliceDefense,一种包含量化分块填充(QCP)和恒定时间边界融合(CTBF)的双部缓解框架。实验证明SpliceDefense能有效消除侧信道信号(Delta TTFT ≈ 0),且吞吐量开销可忽略,同时保留了全局缓存共享的关键优势。本文的发现揭示了内存去重与安全性之间的根本冲突,对LLM安全研究具有重要参考价值。
💡 推荐理由: 首次揭示了RAG系统中非前缀KV缓存融合的侧信道攻击路径,攻击者可获取用户私有提示长度和内容,对基于LLM的敏感应用构成严重隐私威胁。防御方案为缓存共享与安全平衡提供了新思路。
🎯 建议动作: 研究跟进
排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)