推荐 5.5
Conf: 50%
本文是一篇针对大型语言模型(LLM)领域内指纹识别与水印技术的综述论文,旨在统一术语、生命周期阶段和评估目标,为LLM资产保护与溯源建立结构化基础。LLM的研发需要大量数据、算力和专业知识,且正被部署于高风险场景,因此保护LLM相关资产并追踪其来源至关重要。现有工作已在数据集溯源、模型所有权验证和生成内容检测等方面快速扩展,但该领域仍存在碎片化现象:指纹识别与水印的术语使用不一致,方法通常仅在孤立的资产特定场景中研究。为弥补这一差距,论文引入“隐式身份”(implicit identity)作为统一抽象概念,指LLM系统中可验证但不可直接观察的身份信号。区分了两种类型:指纹识别(从内在特性中提取的非侵入式身份)和水印(有意嵌入数据、模型或生成内容中的侵入式身份)。基于此,提出了一个生命周期分类法,将技术按数据集、模型和生成内容三个层面组织,并进一步按验证语义(基于相似性的归因VS基于密钥的验证)细分。最后,建立了一个以可识别性、鲁棒性和可部署性为核心的评估框架,总结了在现实访问和变换场景下的代表性指标。通过统一术语、生命周期阶段和评估目标,该综述为研究LLM身份技术以及开发更可靠的资产保护和溯源机制提供了结构化基础。适合LLM安全研究人员、模型开发者、内容归因系统设计者阅读。
💡 推荐理由: LLM资产保护与溯源成为关键需求,本文首次系统梳理指纹与水印技术,统一术语与评估框架,有助于安全社区建立共识、推动可靠防护方案落地。
🎯 建议动作: 研究跟进
排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)