#machine-unlearning

共收录 4 条相关安全情报。

← 返回所有主题
👥 作者: Ali Mahdavi, Azadeh Zamanifar, Amirfarhad Farhadi, Omid Kashefi

本文针对联邦学习中数据删除请求的合规需求(如GDPR的“被遗忘权”),提出了一种高效且精确的机器学习遗忘方法HF-KCU。联邦学习系统中,客户端可能要求删除其贡献的数据,传统做法是重新训练模型,但计算开销巨大。HF-KCU通过Krylov子空间中的共轭梯度迭代来近似影响函数,从而移除单个客户端的贡献,将计算复杂度从O(d^3)降低到O(kd)(k<<d)。方法引入因果加权机制,确保只有持有被删除数据的客户端收到参数更新,避免对其他未受影响客户端的模型产生扰动。此外,HF-KCU能够处理黑盒对抗扰动(对Hessian和梯度的有界扰动),在现实威胁模型下仍能优雅降级。实验在CIFAR-10、MNIST、Fashion-MNIST数据集上使用卷积网络(ResNet-18、SimpleCNN)和Transformer(ViT-Lite)架构验证。在CIFAR-10上采用Dirichlet(alpha=0.5)分区,HF-KCU相比重训练加速47.75倍,测试精度仅下降0.60%(71.16% vs 71.76%)。成员推理攻击在遗忘集上的成功率为0.499,与重训练的模型一致,证明了有效的隐私恢复。理论分析给出了Krylov近似误差的收敛保证( O((k^{1/2}-1)/(k^{1/2}+1)),k为Hessian条件数)。因果加权机制确保了手术式更新,避免异步联邦设置中基于梯度方法的不稳定性,且每次更新可直接归因于被删除数据的影响。该方法适用于异步删除请求且计算预算受限的生产联邦系统。

💡 推荐理由: 联邦学习中的数据删除合规性面临计算挑战,HF-KCU提供了高效且可对抗扰动的精确遗忘方案,保护用户隐私的同时维持模型性能,对安全工程师设计隐私优先的联邦系统有重要参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
INFO
PAPER 2026-05-14

Reinforcement Unlearning.

推荐 14.5
Conf: 50%
👥 作者: Dayong Ye, Tianqing Zhu, Congcong Zhu, Derui Wang, Kun Gao 0006, Zewei Shi, Sheng Shen 0005, Wanlei Zhou 0001, Minhui Xue 0001

本文首次系统性地研究了强化学习中的机器遗忘问题,即“强化遗忘”。传统机器遗忘研究主要关注监督学习和无监督学习,而强化学习领域中,智能体在与环境交互过程中会记忆环境特征,引发隐私风险。根据数据保护法规,环境所有者有权撤销智能体对训练数据的访问,因此需要让智能体遗忘特定环境的知识。然而,强化遗忘面临三个独特挑战:1) 如何设计针对环境的遗忘方案;2) 如何避免遗忘过程损害智能体在其他环境中的性能;3) 如何有效评估遗忘效果。针对这些挑战,作者提出了两种强化遗忘方法:第一种基于递减强化学习,通过逐步减少目标环境中的奖励信号,使智能体逐渐擦除先前学到的知识;第二种利用环境中毒攻击,在目标环境中注入误导性反馈,迫使智能体学习错误知识以覆盖原有记忆。此外,为了评估遗忘效果,作者引入了“环境推断”概念,即通过分析智能体在目标环境中的行为来判断遗忘是否成功。实验部分(依据摘要推断)在多个连续控制环境中验证了两种方法的有效性,表明它们能在保持其余环境性能的同时实现遗忘,且环境推断能够可靠地量化遗忘程度。该研究填补了强化学习遗忘领域的空白,为隐私合规提供了新的技术路径。

💡 推荐理由: 强化学习广泛应用于机器人、自动驾驶、游戏等场景,环境数据可能包含敏感信息。本文提出的强化遗忘方法首次解决了环境级数据删除的隐私需求,对满足GDPR等法规的“被遗忘权”至关重要,同时启发了安全从业者关注强化学习模型的数据生命周期管理。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Ahmed Mehdi Inane, Vincent Quirion, Gintare Karolina Dzugaite, Ioannis Mitliagkas

本文研究了基于噪声的认证机器学习遗忘问题。现有方法面临一个硬性天花板:为保证遗忘认证所需添加的噪声量通常会严重破坏模型效用,尤其是在大规模删除请求场景下。结合公共数据是差分隐私中缓解这一矛盾的常用技术,但在遗忘领域尚未被充分探索。本文提出非对称朗之万遗忘(ALU)框架,利用公共数据来降低隐私成本。理论证明,注入公共数据能使遗忘成本以 $O(1/n_{\mathrm{pub}}^2)$ 的因子降低,保证了相对于重新训练的计算优势,从而建立了一种新的控制机制:从业者可以通过增加公共数据量来减少高噪声需求及其伴随的效用损失。此外,本文分析了分布不匹配的现实场景,明确刻画了公共与私人源数据之间的分布偏移如何影响效用。实验表明,ALU 能够在模型需要批量遗忘固定比例数据(标准对称方法在此情况下变得不切实际)时保持高效用。基于变分 Rényi 散度与成员推断攻击的实证评估证实,在合理的分布偏移下,ALU 能有效抵御隐私攻击同时保留模型效用。

💡 推荐理由: 为大规模机器学习遗忘提供了一种实用的噪声控制方案,利用公共数据突破效用瓶颈,对隐私法规合规(如GDPR“被遗忘权”)具有直接参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Ishrak Hamim Mahi, Siam Ferdous, Md Sakib Sadman Badhon, Nabid Hasan Omi, Md Habibun Nabi Hemel, Farig Yousuf Sadeque, Md. Tanzim Reza

该论文研究了机器遗忘(Machine Unlearning)领域中的类别级遗忘问题,提出了一种基于 SISA(Sharded, Isolated, Sliced, and Aggregated)框架的改进方案,用于卷积神经网络(CNN)架构。随着图像生成模型等AI系统的普及,数据隐私和用户同意问题日益突出,当用户要求删除其数据时,模型需要能够移除特定数据的影响而无需完全重新训练。论文提出的方法在标准SISA基础上引入了强化重放机制(reinforced replay mechanism)和门控网络(gating network),以增强选择性遗忘的效率。实验在多个图像数据集和不同CNN配置上进行,结果表明该方法能够有效实现类别级遗忘,在保持模型性能的同时显著降低重新训练的开销。论文还指出了SISA类遗忘方法在隐私敏感型AI应用中的部署潜力,并公开了实现代码。适合对机器学习隐私、数据删除合规性以及模型维护效率感兴趣的研究人员和工程师阅读。

💡 推荐理由: 随着数据隐私法规(如GDPR)要求用户数据删除权,机器遗忘技术成为AI合规的关键。该研究提供了实用的类别级遗忘方法,有助于降低模型维护成本,保护用户隐私。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)