#adversarial examples

共收录 1 条相关安全情报。

← 返回所有主题
👥 作者: Hanbin Hong, Xinyu Zhang 0016, Binghui Wang, Zhongjie Ba, Yuan Hong 0001

本文首次提出了一种具有可证明保证的黑盒攻击新范式——可认证黑盒攻击,该攻击能够在查询目标模型之前就保证对抗样本的攻击成功概率(ASP)。与传统的基于查询或迁移性的经验性黑盒攻击不同,这种新攻击揭示了机器学习模型在理论层面上的显著脆弱性。作者建立了一套新颖的理论基础,通过随机化对抗样本来确保ASP的理论保证,无需在目标模型上进行验证或查询。在此基础上,提出了多种创新技术来生成随机化对抗样本,同时减小扰动幅度以提高不可感知性。实验在CIFAR-10/100、ImageNet和LibriSpeech数据集上进行,与16种现有最优黑盒攻击进行了全面对比,并针对计算机视觉和语音识别领域多种最新防御方法进行了测试。理论和实验结果均验证了该攻击的有效性和显著性,表明其能够以可证明的置信度突破强防御,构造出拥有高ASP的无限对抗样本空间。该工作对机器学习安全性研究具有重要理论意义,同时也对现有防御体系提出了严峻挑战。

💡 推荐理由: 该攻击首次从理论上保证了黑盒攻击的成功概率,打破了现有防御的有效性,为攻击方提供了可量化的置信度,可能迫使防御方法进行根本性革新。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)