#model-protection 主题 - Cyber Security Daily Radar

👥 作者: Zihan Wang, Zhongkui Ma, Xinguo Feng, Ruoxi Sun 0001, Hu Wang 0005, Minhui Xue 0001, Guangdong Bai

该论文提出了一种名为CORELOCKER的神经元级使用控制方法，用于保护深度学习模型的知识产权。核心思想是从训练好的神经网络中提取一小部分显著权重作为“访问密钥”，拥有密钥的用户可以获得模型的全部能力，而未授权用户只能获得部分能力。该方法通过形式化分析给出了保护前后网络效用差异的理论上下界，并基于Fashion-MNIST、CIFAR-10和CIFAR-100数据集以及VGGNet、ResNet和DenseNet等真实模型进行了实验验证。实验结果表明CORELOCKER能有效控制模型使用权限，并对基于微调和剪枝的高级模型恢复攻击具有鲁棒性。该工作为模型所有者提供了一种细粒度的访问控制机制，有助于防止模型被滥用或盗用。

💡 推荐理由: 随着深度学习模型商业价值提升，模型使用权保护成为关键。CORELOCKER提供了一种新颖的、基于权重子集的细粒度访问控制方法，有助于维护模型开发者的知识产权。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Zheng Zhong, Ruoyu Wu, Junpeng Wan, Muqi Zou, Dave (Jing) Tian

本文针对深度神经网络（DNN）二进制的逆向工程攻击提出了一种加固方案。DNN模型因其训练过程中涉及的专业知识、机密数据和高昂开发成本而成为专有资产。经过充分训练的DNN模型通常被编译成DNN二进制文件，以便在边缘设备、云基础设施等各种平台上高效执行。然而，近期关于DNN二进制反编译的研究表明，通过二进制逆向工程技术窃取DNN模型是可行的。虽然混淆是阻碍二进制逆向的成熟技术，但由于DNN二进制具有独特的结构特性（如权重参数、层结构等），通用混淆方案无法有效隐藏其中的信息。为此，本文设计了一种针对DNN二进制的专门加固方法，在保持模型推理性能的同时，显著提高攻击者逆向分析和提取模型参数的难度。实验结果表明，该方法能有效抵御多种逆向攻击，且引入的运行时开销较低。该研究为保护DNN模型的知识产权提供了新的技术手段。

💡 推荐理由: 保护DNN模型知识产权是AI安全的核心问题，该工作针对DNN二进制特有的逆向攻击提出专用防御，填补了通用混淆方案的空白。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Beomjin Ahn, Jungmin Kwon, Chanyong Jung, Jaewook Chung

该论文提出了一种名为LoREnc的训练无关框架，用于保护基础模型（FM）和低秩适配器（LoRA adapter）免受知识产权泄露和模型恢复攻击。现有防御方法通常需要重新训练或访问原始数据集，实用性不足。LoREnc通过频谱截断与补偿技术，在不需要重新训练的情况下，抑制FM权重中的主导低秩分量，并在授权适配器中补偿缺失信息；同时采用正交重参数化，模糊受保护适配器的结构指纹。未经授权的用户使用受保护模型时会产生结构坍塌的输出，而授权用户可恢复精确性能。实验表明，LoREnc能够有效防御模型恢复攻击，且计算开销低于1%。该方法适用于边缘设备上的生成式AI场景，在不明显增加推理成本的前提下提供强保护。

💡 推荐理由: 针对FM和LoRA适配器的模型提取攻击日益严重，而现有防御需重训练或原始数据，LoREnc首次实现了训练无关的低开销保护方案，适合资源受限的端侧部署。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

Cyber Security Daily Radar

#model-protection

CORELOCKER: Neuron-level Usage Control.

Hardening Deep Neural Network Binaries against Reverse Engineering Attacks.

LoREnc: Low-Rank Encryption for Securing Foundation Models and LoRA Adapters