#model-protection

共收录 2 条相关安全情报。

← 返回所有主题
推荐 9.5
Conf: 50%
👥 作者: Zihan Wang, Zhongkui Ma, Xinguo Feng, Ruoxi Sun 0001, Hu Wang 0005, Minhui Xue 0001, Guangdong Bai

现代深度神经网络模型在训练过程中需要大量数据、复杂设计和计算资源,因此模型本身蕴含了模型开发者的知识产权。然而,当模型被部署后,获取模型访问权限的实体(模型控制器)可能未经授权使用模型,侵犯模型所有者的权益。本文提出了一种名为 CORELOCKER 的细粒度模型使用控制方法,通过从神经网络中战略性地提取一小部分重要权重子集作为“访问密钥”,来解锁模型的全部能力。模型所有者可以根据需要定制密钥包含的效用级别:授权用户持有密钥即可获得模型的完整功能,而未授权用户仅能访问模型的部分能力,从而实现对模型使用的差异化控制。方法基于形式化基础,提供了保护前后网络效用差异的理论上下界。作者在 Fashion-MNIST、CIFAR-10、CIFAR-100 等数据集以及 VGGNet、ResNet、DenseNet 等真实模型上进行了实验,验证了 CORELOCKER 的有效性,并证明其对基于微调和剪枝的高级模型恢复攻击具有鲁棒性。该研究为神经网络模型的知识产权保护提供了一种新的、可量化的解决方案。

💡 推荐理由: 随着深度学习模型商业价值日益增长,模型知识产权保护成为关键问题。CORELOCKER 提供了一种细粒度的神经元级访问控制机制,从根源上防止模型被滥用,对模型所有者具有重要意义。

🎯 建议动作: 研究跟进:评估该方法在自有模型保护场景中的适用性,并尝试在内部实验中复现。

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Beomjin Ahn, Jungmin Kwon, Chanyong Jung, Jaewook Chung

该论文提出了一种名为LoREnc的训练无关框架,用于保护基础模型(FM)和低秩适配器(LoRA adapter)免受知识产权泄露和模型恢复攻击。现有防御方法通常需要重新训练或访问原始数据集,实用性不足。LoREnc通过频谱截断与补偿技术,在不需要重新训练的情况下,抑制FM权重中的主导低秩分量,并在授权适配器中补偿缺失信息;同时采用正交重参数化,模糊受保护适配器的结构指纹。未经授权的用户使用受保护模型时会产生结构坍塌的输出,而授权用户可恢复精确性能。实验表明,LoREnc能够有效防御模型恢复攻击,且计算开销低于1%。该方法适用于边缘设备上的生成式AI场景,在不明显增加推理成本的前提下提供强保护。

💡 推荐理由: 针对FM和LoRA适配器的模型提取攻击日益严重,而现有防御需重训练或原始数据,LoREnc首次实现了训练无关的低开销保护方案,适合资源受限的端侧部署。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)