#image-diffusion

共收录 1 条相关安全情报。

← 返回所有主题
👥 作者: Jianwei Fei, Yunshu Dai, Zhihua Xia, Xiaochun Cao, Jiantao Zhou, Alessandro Piva, Benedetta Tondi

本文提出了一种针对文本到图像(T2I)扩散模型的高效、鲁棒且抗合谋的模型指纹识别方法。现有模型指纹技术通过向生成图像嵌入用户特定标识符来保护知识产权,但普遍存在一个未探索的系统性漏洞:它们缺乏对抗合谋攻击的鲁棒性。合谋攻击中,多个攻击者联合其模型以移除或隐藏指纹。为此,本文首次提出具有抗合谋能力的T2I模型指纹方法。该方法将二进制位字符串(指纹)编码到个性化归一化模块(PNM)的系数中,该模块被集成到T2I模型中,使得从任何生成图像中都能可靠地恢复指纹。为防御合谋攻击并防止未授权模型再分发,引入了一种基于无损函数不变参数变换的抗合谋机制,该机制显著降低合谋模型的图像生成质量(通过增加FID指标),使其实际上不可用。此外,该方法允许开发者通过重新参数化PNM高效地创建多个带指纹的T2I模型副本,而无需重新训练。还引入了一种最坏情况优化策略,以提高对模型级攻击的鲁棒性。实验表明,该方法在多个T2I图像生成和编辑任务中实现了高保真度和鲁棒性,指纹提取准确率超过99.5%。与现有方法相比,该方法首次通过显著增加合谋模型的FID,展现出对合谋攻击的主动鲁棒性。该研究适合AI安全研究人员、模型开发者及知识产权保护相关从业者阅读。

💡 推荐理由: 揭示了现有模型指纹方法在合谋攻击下的系统性漏洞,并首次提出有效的抗合谋方案,对保护生成式AI模型的版权和防止非法分发具有重要实践意义。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)