#explanation-reconstruction

共收录 1 条相关安全情报。

← 返回所有主题
推荐 3.6
Conf: 50%
👥 作者: Rishi Raj Sahoo, Jyotirmaya Shivottam, Subhankar Mishra

该论文研究了从差分隐私(DP)保护的图神经网络(GNN)解释中重建隐藏图结构的安全风险。虽然差分隐私通常被视为发布解释时降低隐私风险的标准手段,但作者证明了仅依赖DP并不足够:攻击者仅观察到经过DP扰动的GNN解释,就能以高精度重建原始图结构。作者提出的攻击方法PRIVX利用了高斯DP机制实质上是已知噪声水平σ(ε)下的单步DDPM(去噪扩散概率模型)前向过程,将重建问题转化为以被污染信号为条件的反向扩散,从而成为在已知DP扰动下的贝叶斯去噪器。论文形式化了一个分层攻击者模型,参数为(M, ε̂, δ̂, S, ρ),可插值从无信息攻击者到全能攻击者,并推导了重建AUC的端点匹配双边界。针对实践者,论文提供了关于解释器选择的按状态分层指导:在同质图上,相同DP预算下,邻域聚合解释器(如GraphLIME、GNNExplainer)比逐节点梯度解释器泄露更多结构;而在强异质图上顺序相反。此外,论文引入PRIVF作为辅助诊断工具,共享相同的扩散骨干,用于将泄露分解为解释器引起的部分和内在图分布引起的部分。在七个基准数据集、三种DP机制和三种GNN主干网络上的实验表明,PRIVX在五个数据集上实现了AUC大于0.7(ε=5),且攻击在典型部署的隐私预算内成功。

💡 推荐理由: 该研究揭示了一个重要的隐私漏洞:即使GNN解释满足差分隐私,攻击者仍可能重建敏感图结构(如社交关系、分子结构),这对使用GNN解释且依赖DP保护隐私的应用构成严重威胁。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)