#KV-cache 主题 - Cyber Security Daily Radar

👥 作者: He Sun, Shinan Liu, Siyuan Ma, Junhao Li, Mingjun Xiao, Wenhao Jiang

本文揭示了现代大语言模型（LLM）服务引擎中检索增强生成（RAG）和非前缀键值（KV）缓存融合机制存在的一类结构性安全漏洞。与以往需要严格线性前缀对齐的KV缓存侧信道攻击不同，本文发现基于分块感知内存调度的微架构机制会无意中泄露连续的“Step-Wave”时序信号。作者在此基础上提出了SpliceLeak，这是首个针对非前缀KV缓存融合的端到端侧信道攻击。SpliceLeak通过两个阶段实现隐私窃取：首先结构性地指纹识别隐藏私有提示的精确长度，然后通过操纵边界碰撞逐token提取精确语义内容。在结合vLLM和LMCache的生产级框架上评估表明，SpliceLeak在有限熵场景下可达100%的提取成功率，攻击仅需每个token约63次请求即可穿透连续批处理噪声。为缓解该漏洞，作者提出了SpliceDefense，一种包含量化分块填充（QCP）和恒定时间边界融合（CTBF）的双部缓解框架。实验证明SpliceDefense能有效消除侧信道信号（Delta TTFT ≈ 0），且吞吐量开销可忽略，同时保留了全局缓存共享的关键优势。本文的发现揭示了内存去重与安全性之间的根本冲突，对LLM安全研究具有重要参考价值。

💡 推荐理由: 首次揭示了RAG系统中非前缀KV缓存融合的侧信道攻击路径，攻击者可获取用户私有提示长度和内容，对基于LLM的敏感应用构成严重隐私威胁。防御方案为缓存共享与安全平衡提供了新思路。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)

#KV-cache

Agent-Assisted Side-Channel Attacks on Non-Prefix KV Cache in RAG