#deep-learning-security 主题 - Cyber Security Daily Radar

👥 作者: Qiucheng Yu, Tao Ni, Yihe Zhou, Jiayimei Wang, Qingchuan Zhao

本文提出了一种针对视觉-红外融合人脸检测模型的物理对抗补丁攻击方法 VIPatch（视觉-红外补丁）。随着深度学习在多模态融合（如可见光与红外图像）人脸检测中的应用日益广泛，模型面临的对抗性威胁也相应增加。现有的对抗补丁攻击大多仅在数字域针对单一模态（可见光或红外）设计，难以有效攻击融合模型，并且补丁图案往往不自然、容易被察觉。VIPatch 的核心创新在于生成同时作用于可见光和红外图像的逼真补丁，具体通过设计渐变颜色掩码和创可贴形状的贴纸，并联合优化这两个元素，使得生成的数字补丁既具备对抗性又外观自然，进而指导物理补丁的制作。实验在数字域和物理域（如打印贴纸并佩戴）均进行了评估，结果显示 VIPatch 在两个域中对融合模型均达到超过 90% 的攻击成功率，且补丁对人类观察者而言不易引起注意。该工作揭示了多模态人脸检测系统在物理世界中的新漏洞，对于安全从业者理解并防御此类攻击具有重要参考价值。

💡 推荐理由: 视觉-红外融合人脸检测被广泛用于安防、身份认证等关键场景，本文首次提出针对该融合模型的物理域隐身对抗补丁攻击，威胁真实部署系统，需引起防御方高度关注。

🎯 建议动作: 研究跟进

排序因子: 有可用补丁/修复方案 (+3) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Wanlun Ma, Derui Wang, Ruoxi Sun 0001, Minhui Xue 0001, Sheng Wen, Yang Xiang 0001

本文提出了一种名为“Beatrix”的鲁棒后门检测方法，通过利用Gram矩阵来检测深度神经网络中的后门攻击。研究背景是深度神经网络容易受到后门攻击，攻击者在训练阶段注入恶意行为，使得模型在正常输入下表现正常，但在特定触发模式下输出错误结果。现有的后门检测方法往往依赖于特定假设或容易被规避。本文的核心方法是通过分析模型中间层特征的Gram矩阵，捕捉不同层之间的统计相关性，从而识别出后门样本与干净样本之间的差异。具体地，Beatrix计算每个样本的Gram矩阵，并通过对比学习或异常检测算法来区分后门和正常样本。实验表明，该方法在多个基准数据集和多种后门攻击类型（如BadNets、Trojan攻击等）上均表现出高检测率和低误报率，并且对防御已知的规避策略具有鲁棒性。主要贡献包括：提出了一种基于Gram矩阵的后门检测新范式，无需修改训练过程或访问干净训练数据；证明了该方法在多种攻击场景下的有效性；并提供了理论分析支持其鲁棒性。适合研究深度学习安全的后门防御从业者阅读。

💡 推荐理由: 后门攻击是深度学习安全的核心威胁，现有检测方法存在局限。Beatrix利用Gram矩阵提供了一种无需训练数据且鲁棒的检测手段，能有效识别多种后门攻击，对防御者构建可信AI系统具有直接参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Sihui Dai, Saeed Mahloujifar, Prateek Mittal

深度神经网络对对抗性扰动输入存在脆弱性，对抗训练是一种常用的防御手段，其效果受到模型架构的影响。以往研究探讨了改变模型宽度和深度对鲁棒性的影响，但尚未系统研究使用可学习参数化激活函数（PAF）的影响。本文旨在探究PAF是否能在对抗训练中提升鲁棒性。作者首先提出一个问题：改变激活函数形状能否提高鲁棒性？为此，他们选取了一组可调参数的PAF，能够独立控制负输入、接近零输入和正输入区域的行为。使用这些PAF，在固定形状参数下进行对抗训练，发现各个区域都会影响鲁棒性，但仅在某些区域（接近零和正输入）的调整能优于ReLU。随后，他们将可学习PAF与对抗训练结合，分析鲁棒性能。结果表明，激活函数的选择显著影响训练模型的鲁棒性，只有特定PAF（如平滑PAF）能在ReLU基础上显著提升鲁棒性。总的来说，该工作凸显了激活函数在对抗训练模型中的重要性。

💡 推荐理由: 激活函数的选择常被忽视，本文首次系统证明可学习参数化激活函数能显著提升对抗鲁棒性，为设计更鲁棒的神经网络架构提供了新方向。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Yinbo Yu, Xueyu Yin, Jing Fang, Chunwei Tian, Qi Zhu, Jiajia Liu, Daoqiang Zhang

深度神经网络（DNN）仍然容易受到后门攻击，现有后门检测方法通常需要干净数据、代理数据、梯度或迭代触发器重建，导致计算成本高且在实际模型审计场景中鲁棒性有限。本文提出HTell，一种快速、轻量级且无需数据的后门检测方法，基于头部随机探针技术。HTell的核心洞察是：后门模型在随机潜在探针下，预测头部的目标类别上往往表现出异常高的响应集中度。该方法首先生成架构感知的随机潜在探针，直接馈入模型头部，然后通过分析类别级响应统计量来检测后门，无需访问真实/代理数据、模型梯度或参数优化。在包含超过6000个后门模型和700多个干净模型的大规模基准上进行评估，覆盖4个数据集、14种架构和21种后门攻击类型。HTell实现了99.03%的真阳性率和2.11%的假阳性率，每模型检测延迟仅为12.69毫秒，相比基于梯度的代表性检测器时间成本降低超过30,000倍。结果表明，头部随机探针为大规模无数据后门模型审计提供了准确、鲁棒且高效的解决方案。

💡 推荐理由: HTell实现了无需数据、快速且高精度的后门检测，大幅降低了模型审计的计算门槛，适合安全团队在本地或云端大规模部署前对第三方模型进行黑盒筛查。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

Cyber Security Daily Radar

#deep-learning-security

Hiding in Plain Sight: An Effective Physical Adversarial Patch Attack against Visual-Infrared Fused Face Detection

The "Beatrix" Resurrections: Robust Backdoor Detection via Gram Matrices.

Parameterizing Activation Functions for Adversarial Robustness.

Fast and Lightweight Backdoor Detection via Head Random Probing

#deep-learning-security

Hiding in Plain Sight: An Effective Physical Adversarial Patch Attack against Visual-Infrared Fused Face Detection

The &quot;Beatrix&quot; Resurrections: Robust Backdoor Detection via Gram Matrices.

Parameterizing Activation Functions for Adversarial Robustness.

Fast and Lightweight Backdoor Detection via Head Random Probing

The "Beatrix" Resurrections: Robust Backdoor Detection via Gram Matrices.