本文是一篇系统化知识(SoK)论文,聚焦于机器学习管道中对手合谋的问题。现有的对抗性攻击研究通常孤立地考虑单一对手,但实际场景中对手可能通过合谋来放大攻击效果。论文首先提出一个系统化框架,涵盖两类合谋场景:(a)训练时对手与推理时对手之间的合谋;(b)推理时多个对手之间的合谋。框架识别了促成合谋的关键因素,包括对手目标、知识、能力以及攻击的时序依赖性等。基于这些因素,作者提出一套指导原则,用于推测哪些合谋组合是可能发生的。利用该指导原则,论文重新解释了先前工作中存在的隐含合谋关系,并推测了五种尚未被探索的合谋案例。随后,作者通过实验验证了这五种合谋确实存在且能显著增强攻击效果。最后,论文讨论了合谋对手的不同特征(如目标冲突、能力差异)如何影响合谋的潜力与可行性。该工作为ML安全社区提供了统一的分析视角,有助于设计更鲁棒的防御策略。适合安全研究人员、ML工程师以及对抗性机器学习领域的学生阅读。
💡 推荐理由: 首次系统化分析机器学习管道中对手合谋问题,揭示合谋可能放大攻击效果,为安全评估和防御设计提供新视角。
🎯 建议动作: 研究跟进