现代深度神经网络模型在训练过程中需要大量数据、复杂设计和计算资源,因此模型本身蕴含了模型开发者的知识产权。然而,当模型被部署后,获取模型访问权限的实体(模型控制器)可能未经授权使用模型,侵犯模型所有者的权益。本文提出了一种名为 CORELOCKER 的细粒度模型使用控制方法,通过从神经网络中战略性地提取一小部分重要权重子集作为“访问密钥”,来解锁模型的全部能力。模型所有者可以根据需要定制密钥包含的效用级别:授权用户持有密钥即可获得模型的完整功能,而未授权用户仅能访问模型的部分能力,从而实现对模型使用的差异化控制。方法基于形式化基础,提供了保护前后网络效用差异的理论上下界。作者在 Fashion-MNIST、CIFAR-10、CIFAR-100 等数据集以及 VGGNet、ResNet、DenseNet 等真实模型上进行了实验,验证了 CORELOCKER 的有效性,并证明其对基于微调和剪枝的高级模型恢复攻击具有鲁棒性。该研究为神经网络模型的知识产权保护提供了一种新的、可量化的解决方案。
💡 推荐理由: 随着深度学习模型商业价值日益增长,模型知识产权保护成为关键问题。CORELOCKER 提供了一种细粒度的神经元级访问控制机制,从根源上防止模型被滥用,对模型所有者具有重要意义。
🎯 建议动作: 研究跟进:评估该方法在自有模型保护场景中的适用性,并尝试在内部实验中复现。