#copyright-protection

共收录 3 条相关安全情报。

← 返回所有主题
👥 作者: Tsun On Kwok, Xi Yang, Ki Sen Hung, Chang Liu, Yangqiu Song

该论文提出了 SentinelRAG,一种用于保护专有 RAG(检索增强生成)数据库版权的数字水印框架。现有水印方法存在两个主要问题:一是通过在真实实体之间注入虚假关系来污染知识库,从而引入错误信息;二是嵌入的脆弱词汇模式容易被对抗性改写删除。SentinelRAG 的核心思想是在 RAG 数据库中嵌入风格一致但虚构的知识条目。这些虚构知识描述的是不存在的实体,合法用户查询时几乎不会被检索到,但数据所有者可以通过仅自己知道的特定目标探针可靠地触发检测。实验在四个文档数量从 2.9k 到 8.8M 不等的数据集上进行,结果显示,在仅 0.1% 的注入率下,SentinelRAG 在所有测试配置中均实现了统计显著的检测(p < 10^-5)。与现有技术相比,该方法显著降低了误检率,同时几乎不影响合法用户的查询。该工作为保护知识产权提供了一种新的思路,尤其适用于使用外部数据库的 LLM 应用场景。

💡 推荐理由: 该研究为保护企业级RAG数据库知识产权提供了新方案,能够有效检测未经授权的数据分发,对AI数据资产管理具有实际意义。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Yan Liang, Ziyuan Yang, Mengyu Sun, Joey Tianyi Zhou, Yi Zhang

本文针对数据集蒸馏(Dataset Distillation, DD)技术中的版权保护问题展开研究。DD通过合成小型但信息丰富的数据集来降低大规模数据集的存储、计算和能源成本,但其易复制和分发的特性带来了严重的版权侵权和数据泄露风险。现有的保护方法主要针对原始数据集设计,且通常依赖于后门触发的恶意行为,可能引发安全担忧。作者观察到深度神经网络在训练过程中会记忆子群体分布,导致系统性预测偏差,即模型对与记忆子群体对齐的样本表现更好。基于此,提出了一种无害的子群体驱动保护框架SubPopMark,用于蒸馏数据集。SubPopMark包含两个阶段:首先,版权验证标记优化阶段注入类一致性的子群体偏差,同时保留原始优化轨迹;其次,用户特定追踪标记优化阶段进一步向标记增强数据引入用户可区分的扰动。为实现黑盒验证与追踪,作者通过构建覆盖标准分布和子群体偏移分布的精心设计测试集上的模型输出,建立参考行为库。可疑模型的来源通过将其输出行为签名与库中模式比对,识别最一致的参考行为模式来推断。实验将证明该方法在不引入恶意后门的前提下,有效实现对蒸馏数据集的版权保护和用户追踪。

💡 推荐理由: 数据集蒸馏的版权保护是实际部署中的关键问题,现有方法存在安全担忧。本文提出无害保护框架,为安全从业者提供了在蒸馏场景下进行版权验证和溯源的新思路。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Cong Kong, Xin Cheng, Zhaoxia Yin, Shuai Li, Jie Zhang, Weiming Zhang

随着垂直领域预训练语言模型(VPLMs)在医疗、金融、法律等专业领域的广泛应用,模型参数和推理能力已成为重要的数字资产。如何实现VPLMs的可追溯版权验证成为一个迫切挑战。现有的版权验证方法主要依赖向模型嵌入后门水印,但这些方法大多需要额外的训练过程,水印嵌入效率低下,且缺乏面向多垂直领域的可扩展设计。针对上述局限,本文提出了VertMark——首个统一的、无需训练且鲁棒的版权水印框架,适用于多个垂直领域的VPLMs。该框架通过一种无训练的参数替换策略,在低频触发令牌与高频领域相关词之间建立隐藏的语义等价关系,从而嵌入带有所有权编码的水印。实验在医疗、金融、法律三大领域的文本理解和文本生成下游任务上验证了VertMark的有效性:它能够实现高效的水印嵌入和可靠的水印验证,同时对模型性能的影响可忽略不计。此外,VertMark对剪枝、量化等多种攻击展现出强鲁棒性,凸显了其实用价值,为VPLMs的版权安全提供了有力保护。本文适合模型提供方、安全研究人员及关注知识产权保护的技术从业者阅读。

💡 推荐理由: 本文提出了一种针对垂直领域预训练语言模型的无需训练、可扩展的水印方案,可有效防止模型被非法复制或滥用,为模型版权保护提供了新的技术手段。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)