推荐 10.5
Conf: 50%
检索增强生成(RAG)通过引入外部知识显著提升了大型语言模型(LLM)的能力,但其在云环境中的部署面临敏感数据的隐私泄露风险。现有隐私保护方案往往因噪声注入而牺牲检索质量,或仅提供部分加密。本文提出PRAG,一种端到端隐私保护RAG系统,在保持云托管RAG可扩展性的同时,实现文档和查询的端到端机密性。PRAG采用双模式架构:非交互式PRAG-I利用同态友好近似实现低延迟检索,而交互式PRAG-II借助客户端辅助达到与非隐私RAG相当的精度。为确保语义排序的鲁棒性,引入了操作误差估计(OEE)机制,以稳定对抗同态噪声的排序。在大型数据集上的实验表明,PRAG在保持端到端机密性的同时,实现了有竞争力的召回率(72.45%-74.45%)、实用的检索延迟以及对图重构攻击的强韧性。该工作证实了大规模安全高性能RAG的可行性。
💡 推荐理由: PRAG解决了云环境下RAG的隐私保护核心痛点,在不牺牲准确性和可扩展性的前提下实现了端到端机密性,为隐私敏感的LLM应用提供了实用方案。
🎯 建议动作: 研究跟进
排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)