该论文研究了针对表格扩散模型的成员推断攻击(Membership Inference Attack, MIA)。扩散模型在合成表格数据方面表现出色,常被用于共享敏感记录,但其隐私保护能力受到质疑。现有成员推断攻击通常假设单表设置,忽略了真实敏感数据中的多表关系结构。论文指出,在多表场景下评估隐私风险的核心挑战在于如何利用与目标表相关联的辅助信息(如其父表)。然而,在攻击推理时,攻击者只能观察到目标表中目标记录的属性值。为此,作者提出了FERMI(FEature-mapping for Relational Membership Inference)方法,通过将单表特征与关系成员信号相结合来解决这一差距。FERMI 首先在训练阶段利用辅助关系表学习一个特征映射,将多表关系转化为单表特征上的增强信号;在推理时仅需目标记录的属性值即可进行成员推断。实验基于三种表格扩散架构(如 CTGAN、TableDiffusion 等)和三个真实关系数据集(如 IMDB、Airbnb 等),评估了白盒和黑盒设置下的攻击性能。结果显示,FERMI 在假阳性率(FPR)为0.1时,真阳性率(TPR)在白盒设置下比单表基线提升高达53%,在黑盒设置下提升22%。论文的主要贡献在于首次将关系结构引入表格扩散模型的成员推断攻击,并提出了有效的特征映射方法,显著提高了攻击效果。该研究提醒数据发布者:即使在推理时仅释放单表数据,多表关系在训练阶段的存在仍可能被攻击者利用,从而加剧隐私泄露风险。适合从事数据隐私、机器学习安全的研究人员以及使用合成数据发布敏感信息的组织阅读。
💡 推荐理由: 揭示了表格扩散模型在多表关系场景中未被重视的隐私泄露渠道,为数据发布者评估合成数据的成员隐私风险提供了新视角,具有重要警示意义。
🎯 建议动作: 研究跟进