#deep-neural-network

共收录 1 条相关安全情报。

← 返回所有主题
推荐 8.5
Conf: 50%
👥 作者: Yinbo Yu, Jing Fang, Xuewen Zhang, Chunwei Tian, Qi Zhu, Daoqiang Zhang, Jiajia Liu

本文针对深度神经网络(DNN)的后门攻击检测问题,提出了一种轻量级、快速的静态参数检测框架DFBScanner。现有防御方法通常依赖激活异常分析或触发器逆向工程,往往需要干净样本或先验知识,导致效率低、实用性差、泛化能力不足。尤其严重的是,虽然先进的后门攻击可以在毫秒级完成注入,但现有检测方法通常需要数分钟甚至数小时。DFBScanner基于一个关键观察:后门引起的特征扰动会导致最终分类层中出现独特且异常的参数更新。因此,该方法将检测焦点从识别多样且攻击特定的触发器模式,转移到识别最终层中统一的后门表现,从而实现高效且攻击无关的检测。具体地,通过构建并策略性地组合最终层参数的多个异常指标到一个特洛伊线索中,DFBScanner通过最大异常评分来检测后门。该方法在大规模后门基准上进行了评估,包括超过5000个后门模型,涵盖4个数据集、12种网络架构、20种后门触发器类型、2种攻击策略(all-to-one和all-to-all)以及3种后门注入方法(数据投毒、训练流程操纵和比特翻转)。数值结果表明,DFBScanner实现了97.17%的真正率、0.95%的假正率,且每个模型的平均检测时间仅为1毫秒,显著优于先前方法。该研究适合安全研究人员、AI系统防御工程师以及对模型后门检测感兴趣的从业者阅读。

💡 推荐理由: 提出了一种毫秒级、高精度的后门模型检测方法,解决了现有方法效率低、依赖先验知识的痛点,可直接用于AI模型供应链安全的快速筛查。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)