#dnn-security 主题 - Cyber Security Daily Radar

👥 作者: Yanzuo Chen, Yuanyuan Yuan 0001, Shuai Wang 0011

本文针对深度学习编译器生成的DNN可执行文件缺乏安全保护的问题，提出了OBSan，一种用于检测DNN可执行文件中越界（Out-of-Bound, OOB）行为的快速消毒器。DNN涉及双向计算：前向传播（预测输出）和后向传播（梯度计算）。神经元激活值和梯度都应落在有效范围内，偏离则视为OOB。OOB主要由异常输入引发，可能导致误预测甚至被对抗样本利用。OBSan包含两个变体：FOBSAN检测前向传播中的OOB，BOBSAN检测后向传播中的OOB。两者作为DL编译器的额外pass集成到大规模DNN模型中，并设计了多种优化方案降低开销。在多种异常输入下的评估表明，OBSan具有良好的OOB检测能力且开销低。此外，论文展示了两个下游应用：阻止在线对抗样本生成和促进面向DNN可执行文件的反馈驱动模糊测试。该研究适合编译器开发、DNN安全研究人员及AI系统防御者阅读。

💡 推荐理由: 首次针对DL编译器生成的DNN可执行文件提出安全消毒方案，填补了该领域空白，可有效检测由异常输入引发的越界行为，提升DNN模型的鲁棒性和安全性。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Samuele Pasini, Jinhan Kim, Paolo Tonella

现代深度神经网络（DNN）通过反复微调来融入新数据与功能，但这种演进工作流引入了安全风险：当更新数据不完全可信时，攻击者可能在微调过程中植入后门（Trojan）。现有的后门检测方法通常需要重建触发器或依赖干净验证集，假设条件强且计算开销大。本文提出MIST（Malicious update Identification via Spectral regression），一种基于谱回归分析的后门检测方法。核心思想是：良性微调过程中，模型内部表示（各层预激活值）的谱分布变化具有一致的模式；而后门植入会导致谱偏离这种良性演化模式。MIST将后门检测视为模型更新上的回归问题：首先在良性微调阶段建立预激活谱的参考分布，然后计算每次更新的谱距离，若距离显著偏离参考则标记为恶意。实验在CIFAR-10、GTSRB、Tiny-ImageNet和SVHN四个数据集以及BadNets、TrojanNN等八种后门攻击下进行。结果表明：单次更新后，MIST即可可靠区分后门更新与干净微调，检测准确率优于现有方法（如Neural Cleanse、STRIP等）；在多次良性更新后，性能仅有轻微且可控的退化。MIST无需了解任何中毒数据或触发条件，也不假设攻击方式，是一种假设轻量、鲁棒性强的检测信号。适合关注模型供应链安全、微调安全的研究人员和工程团队。

💡 推荐理由: 针对微调场景下的后门注入攻击提出了一种无需先验知识的检测方法，利用谱演化信号实现高准确率，对保障模型供应链安全具有实际意义。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

Cyber Security Daily Radar

#dnn-security

OBSan: An Out-Of-Bound Sanitizer to Harden DNN Executables.

Detecting Trojaned DNNs via Spectral Regression Analysis