该论文提出了 SentinelRAG,一种用于保护专有 RAG(检索增强生成)数据库版权的数字水印框架。现有水印方法存在两个主要问题:一是通过在真实实体之间注入虚假关系来污染知识库,从而引入错误信息;二是嵌入的脆弱词汇模式容易被对抗性改写删除。SentinelRAG 的核心思想是在 RAG 数据库中嵌入风格一致但虚构的知识条目。这些虚构知识描述的是不存在的实体,合法用户查询时几乎不会被检索到,但数据所有者可以通过仅自己知道的特定目标探针可靠地触发检测。实验在四个文档数量从 2.9k 到 8.8M 不等的数据集上进行,结果显示,在仅 0.1% 的注入率下,SentinelRAG 在所有测试配置中均实现了统计显著的检测(p < 10^-5)。与现有技术相比,该方法显著降低了误检率,同时几乎不影响合法用户的查询。该工作为保护知识产权提供了一种新的思路,尤其适用于使用外部数据库的 LLM 应用场景。
💡 推荐理由: 该研究为保护企业级RAG数据库知识产权提供了新方案,能够有效检测未经授权的数据分发,对AI数据资产管理具有实际意义。
🎯 建议动作: 研究跟进