#adversarial-robustness

共收录 5 条相关安全情报。

← 返回所有主题
👥 作者: Sihui Dai, Saeed Mahloujifar, Prateek Mittal

深度神经网络对对抗性扰动输入存在脆弱性,对抗训练是一种常用的防御手段,其效果受到模型架构的影响。以往研究探讨了改变模型宽度和深度对鲁棒性的影响,但尚未系统研究使用可学习参数化激活函数(PAF)的影响。本文旨在探究PAF是否能在对抗训练中提升鲁棒性。作者首先提出一个问题:改变激活函数形状能否提高鲁棒性?为此,他们选取了一组可调参数的PAF,能够独立控制负输入、接近零输入和正输入区域的行为。使用这些PAF,在固定形状参数下进行对抗训练,发现各个区域都会影响鲁棒性,但仅在某些区域(接近零和正输入)的调整能优于ReLU。随后,他们将可学习PAF与对抗训练结合,分析鲁棒性能。结果表明,激活函数的选择显著影响训练模型的鲁棒性,只有特定PAF(如平滑PAF)能在ReLU基础上显著提升鲁棒性。总的来说,该工作凸显了激活函数在对抗训练模型中的重要性。

💡 推荐理由: 激活函数的选择常被忽视,本文首次系统证明可学习参数化激活函数能显著提升对抗鲁棒性,为设计更鲁棒的神经网络架构提供了新方向。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Shuo Wang 0012, Hongsheng Hu, Jiamin Chang, Benjamin Zi Hao Zhao, Minhui Xue 0001

该论文提出了一种名为 LACMUS(Latent Concept Masking for Robustness)的通用鲁棒性增强方法,旨在提升深度神经网络(DNN)对对抗攻击和分布偏移的鲁棒性。作者认为,DNN 对对抗扰动和分布漂移的敏感性源于模型过度拟合数据集中的非共同概念(non-common concepts),导致依赖特定学习实例而增加脆弱性。LACMUS 通过将高维数据映射到潜在概念空间,识别并导航“非共同概念”的模式,然后应用概念掩蔽策略选择性遮蔽数据特征,迫使模型基于更广泛的信息进行决策,从而增强决策鲁棒性。该方法是一种攻击无关(attack-agnostic)的框架,采用概念级增强(concept-wise augmentation)来提升模型对多种对抗、语义和分布挑战的鲁棒性。论文贡献包括:开发了鲁棒性增强工具、提供了将数据映射到潜在概念空间的机制、识别概念级误分类模式的策略、以及利用潜在概念的新颖数据增强模块。实验在 MNIST、CIFAR-10、ImageNet 和 CelebA 数据集上进行,验证了 LACMUS 在增强模型弹性和泛化能力方面的有效性,即使训练数据稀缺时也有效。此外,论文向研究社区提供了增强后的数据集,以支持模型鲁棒性训练。

💡 推荐理由: 该方法提供了一种通用、攻击无关的 DNN 鲁棒性增强技术,无需先验对抗知识,可提升模型对多种扰动和分布变化的防御能力,对安全防御中模型加固具有潜在价值。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Shang Shang, Ruiqi Wang, Ruijie Qi, Hao Li, Yingxiao Xiang, Yepeng Yao, Zhengwei Jiang

本文提出了一种名为 PhishSigma++ 的恶意邮件检测方法,旨在解决现有检测器过度依赖易变的文本特征、在对抗性文本操纵下性能急剧下降的问题。研究背景是随着 AI 生成内容(AIGC)的发展,攻击者具备了更丰富的语言能力和逃避技术。核心洞察是:即使攻击者修改表面文本,功能意图仍会约束实体间的关系,这些关系是相对不变的信号。方法上,PhishSigma++ 借鉴了 Sigma 规则的思想,但将其推广到基于实体关系的检测。它从 RFC822 邮件中提取 40 种类型的实体类,计算 5 种跨类型关系以构建类型化邮件图,并使用粒子群优化(PSO)选择稀疏判别掩码,支持分类和类型级证据总结。在 29,142 条消息上,PhishSigma++ 在干净数据上达到 0.9675 F1 分数,在非自适应 Good Word 填充攻击(rho=0.8)下保持 0.9579 F1,而基于 token 的贝叶斯过滤器崩溃至 0.0243,DistilBERT 钓鱼检查点降至 0.7284。相比传统 Sigma 规则,PhishSigma++ 提供了更高的检测率、更广泛的 relational invariance 覆盖和数据驱动的特征选择。此外,阈值化的类型关系分数编码了 Sigma 风格字段条件的有效片段,将手工规则逻辑和学习到的关系掩码统一到单邮件框架中。

💡 推荐理由: 该研究揭示了对抗性文本操纵下邮件检测的脆弱性,并提出了基于实体关系的鲁棒检测方法,对安全运营中提升钓鱼邮件检测的对抗鲁棒性具有参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Brody Kutt, William Hewlett, Oleksii Starov, Yuchen Zhou

本文提出了一种名为“Innocent Until Proven Guilty (IUPG)”的新型深度学习训练框架,旨在解决传统分类器(使用分类交叉熵损失)在真实世界环境中面临的三个关键问题:对分布外输入给出过度自信的后验概率、对对抗性噪声的敏感性以及因分布偏移导致的性能下降。作者认为这些问题的核心缺陷是模型无法有效处理输入中的分布外内容。IUPG框架通过在输入空间中原型化训练数据簇或类别,并独特地利用噪声和固有随机类来发现所建模类别的噪声鲁棒、唯一可识别的特征。在评估中,作者使用了学术计算机视觉数据集以及用于恶意软件分类的真实世界JavaScript和URL数据集。实验结果表明,与相同拓扑结构、使用分类交叉熵训练的基线网络相比,IUPG框架在测试数据上取得了良好的分类性能,减少了因近期偏差导致的性能损失,降低了噪声样本上的误报率,并在多种基于噪声的攻击模拟中降低了脆弱性。据作者所知,这是首个展示在恶意软件黑盒附加攻击上显著降低脆弱性的工作。通过应用快速梯度符号法(FGSM),作者展示了将IUPG与现有对抗学习技术结合的潜力,并取得了显著更优的性能。该框架具有通用性,可用于任何原本可以使用分类交叉熵训练的网络拓扑。

💡 推荐理由: 该工作针对恶意软件检测中常见的分布外样本和对抗攻击问题,提出了一种增强鲁棒性的训练框架,有助于提升安全模型的防御能力。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Temoor Ali, Shehel Yoosuf, Mouna Rabhi, Mashael Al Sabah, Hao Yun

该论文针对住宅代理检测问题,提出了一种超越传统RTT(往返时间)特征的对抗鲁棒两层级检测架构。住宅代理常被用于隐匿恶意流量,传统基于RTT的检测方法易受对抗性攻击。本文设计了两层级检测系统:第一层基于轻量级特征快速筛选可疑流量,第二层采用更鲁棒的深度模型进行精确分类,并引入对抗训练增强对逃避攻击的抵抗力。实验表明,该方法在保持高检测率的同时,显著提升了对抗样本下的鲁棒性。研究为代理检测领域提供了新的思路,适合安全运维人员及入侵检测研究者参考。

💡 推荐理由: 住宅代理检测是防御隐匿攻击的关键,传统RTT方法易被绕过,本文提出的对抗鲁棒架构可提升检测系统在实际对抗环境下的可靠性。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)