推荐 5.5
Conf: 50%
大型语言模型(LLMs)在交互式和检索增强场景中日益部署,引发了显著的隐私担忧。以往的研究通常孤立地分析成员推断攻击(MIA)、属性推断攻击(AIA)、数据提取攻击(DEA)和后门攻击(BA),缺乏对它们在常见系统因素下行为的统一理解。本文首先建立了一个统一的威胁模型和符号体系,复现了一组具有代表性的隐私攻击,随后开展结构化消融研究,系统评估模型架构、规模、数据集特征以及检索配置等关键因素对攻击效果的影响。实验发现:基于掩码的成员推断攻击表现出强且稳定的信号;后门攻击凭借其触发机制获得始终如一的高成功率;属性推断和数据提取攻击仍具挑战,准确率较低,但因其针对敏感个人信息而风险突出。总体而言,LLM系统中的隐私风险高度依赖上下文,并受设计选择驱动,强调了全面评估和知情部署实践的必要性。
💡 推荐理由: 该工作统一了多种隐私攻击的评估框架,揭示出攻击效果对模型选择、数据集配置等系统因素的依赖性,有助于安全团队在部署LLM时进行更精准的隐私风险评估。
🎯 建议动作: 研究跟进
排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)