#clean-label

共收录 1 条相关安全情报。

← 返回所有主题
👥 作者: Philemon Hailemariam, Birhanu Eshete

机器学习模型在依赖不可信训练数据时面临后门攻击的风险,攻击者通过污染训练数据植入隐藏行为。现有防御方法难以应对日益隐蔽的攻击,尤其是干净标签后门攻击,因为它们无法监控单个训练样本对模型更新的细粒度影响。本文提出PoisonSpot系统,受动态污点跟踪启发,通过细粒度训练来源跟踪精确检测干净标签后门攻击。PoisonSpot在训练过程中捕获并分析每个训练样本对模型参数更新的影响,根据影响谱系为可疑样本分配中毒分数,从而准确识别并拒绝携带后门触发器的样本。该系统在多个基准数据集(如CIFAR-10、GTSRB)和攻击场景(包括不同触发器类型和污染率)下进行评估,与现有最优防御方法相比,PoisonSpot始终实现高真阳性率、低假阳性率,并能有效缓解后门攻击,即使面对自适应对抗策略也表现鲁棒。此外,PoisonSpot在多种训练设置(如从头训练、再训练、微调)中高效运行,展现出良好的可扩展性和实用性。实验结果表明,PoisonSpot在准确性和效率上均优于现有方法,为机器学习供应链安全提供了一种新的、可部署的防御手段。

💡 推荐理由: 干净标签后门攻击难以被现有防御检测,PoisonSpot通过跟踪训练样本对参数更新的影响实现了精准识别,为ML模型的数据安全提供了可落地的防御思路,特别适用于第三方数据或众包场景。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)