本文提出 AutoDA(Automated Decision-based Iterative Adversarial Attacks),一种自动化决策型迭代对抗攻击方法。传统决策型攻击需要人工设计查询策略和超参数,效率低且泛化性差。AutoDA 通过自动搜索最优的迭代攻击方案,包括步长、扰动方向更新策略等,从而在有限的查询次数内高效生成对抗样本。该方法在黑盒场景下(仅能获得模型最终决策)实现高攻击成功率,同时在ImageNet等大规模数据集上验证了其有效性。实验表明,AutoDA 在攻击成功率和查询效率上均优于现有决策型攻击方法,并揭示了当前深度神经网络在决策级鲁棒性上的脆弱性。
💡 推荐理由: 该研究自动化了决策型对抗攻击的调参过程,降低了攻击门槛,可能被攻击者利用来更高效地评估模型鲁棒性或发起黑盒攻击。
🎯 建议动作: 研究跟进