该论文研究纵向联邦学习(Vertical Federated Learning, VFL)中的隐私泄露问题,聚焦于数据重建攻击。VFL是一种允许多个参与方在不共享原始数据的情况下,基于同一组样本的不同特征共同训练模型的协作学习范式。然而,VFL面临来自数据重建攻击的隐私威胁。现有攻击主要分为两类:诚实但好奇(HBC)攻击,即攻击者遵守协议但试图窃取数据;以及恶意攻击,即攻击者违反训练协议以获取更多数据泄露。目前大多数研究集中于HBC场景,对恶意攻击的探索有限。在VFL中发起有效的恶意攻击面临两大挑战:首先,由于客户端的数据特征和模型是分布式的,每个客户端严格保护其隐私并禁止直接查询,使得窃取数据变得困难;其次,现有恶意攻击会改变底层VFL训练任务,因此容易通过比较接收到的梯度与诚实训练中的梯度而被检测到。为克服这些挑战,本文提出了URVFL,一种能够逃避现有检测机制的新型攻击策略。其核心思想是集成一个带有辅助分类器的判别器,充分利用标签信息生成针对受害客户端的恶意梯度:一方面,标签信息有助于更好地区分不同类别的样本嵌入,从而提升重建性能;另一方面,利用标签信息计算恶意梯度能更好地模拟诚实训练,使恶意梯度与诚实梯度难以区分,从而让攻击更加隐蔽。全面的实验表明,URVFL显著优于现有攻击,并成功规避了最先进的恶意攻击检测方法。额外的消融研究和针对防御措施的评估进一步证明了URVFL的鲁棒性和有效性。该研究揭示了纵向联邦学习中对恶意攻击检测的不足,对VFL安全设计具有重要警示意义。
💡 推荐理由: 揭示了纵向联邦学习现有检测机制对新型恶意攻击的脆弱性,提醒蓝队和安全工程师关注VFL训练过程中梯度交换环节的隐形泄露风险。
🎯 建议动作: 研究跟进,评估内部VFL系统对类似攻击的防御能力,并考虑引入更鲁棒的梯度验证方法。