#adversarial-example

共收录 1 条相关安全情报。

← 返回所有主题
👥 作者: Meng Shen 0001, Jiangyuan Bi, Hao Yu 0017, Zhenming Bai, Wei Wang 0012, Liehuang Zhu

本文针对商用深度学习服务中的对抗样本检测问题,提出了一种名为“建设性噪声”的新型防御方法。该方法通过向输入数据添加精心设计的噪声,使得正常样本和对抗样本在模型内部表示上产生可区分的差异,从而有效检测出对抗扰动。核心思路是利用噪声的构造性来对抗攻击者的破坏性噪声,通过设计一个噪声生成网络,使其输出与模型决策边界对齐,增强正常样本的鲁棒性同时放大对抗样本的异常特征。实验在多个商用DNN服务(如云端分类API)和标准数据集上进行,结果表明该方法能在保持较低误报率的前提下,显著提升对抗样本的检测率,且对多种攻击算法(如FGSM、PGD、C&W)具有泛化能力。主要贡献包括:1) 提出一种无需修改原始模型的新型检测框架;2) 设计了噪声构造与融合机制;3) 在真实商用场景中验证了有效性。适合从事AI安全、对抗机器学习防御的工程师与研究人员阅读。

💡 推荐理由: 对抗样本对商用DNN服务构成严重威胁,本文提出的建设性噪声检测方法无需改动模型,易于部署,为云端AI服务提供了一种轻量级、高精度的防御手段。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.3)