推荐 3.5
Conf: 50%
本文提出一种名为 SAMark 的自锚定文本水印框架,旨在解决语义级文本水印在段落级改写攻击下鲁棒性不足的问题。传统语义水印以句子为基本单元,依赖于句子顺序,而段落级改写(如重排句子顺序、同义替换等)会全局破坏水印信号。SAMark 通过建立语义空间中与句子顺序无关的“自锚定”绿色区域,消除了水印对句子顺序的依赖。为提高可检测性,作者引入多通道双曲评分机制,利用双曲空间的几何特性放大水印信号并抑制弱对齐候选带来的噪声。此外,还提出一种结合硬过滤与软正则化的多样性感知过滤策略,超越简单的 n-gram 重复过滤,有效降低语义冗余。实验在多个数据集上采用典型段落级改写攻击(如句子重排、同义改写等),SAMark 在 1% 假阳性率下实现了最高 90.2% 的真阳性率,平均比最强基线方法提升超过 30%,同时保持与未加水印文本相当的生成本质量,打破了先前方法在鲁棒性与生成质量之间的权衡。该工作适用于 AI 生成文本的版权保护、溯源、防伪等场景,为抵御高级改写攻击提供了新思路。
💡 推荐理由: 随着大语言模型生成文本的广泛应用,文本水印成为关键的溯源和版权保护技术。SAMark 首次针对段落级改写攻击提供强鲁棒性,填补了现有水印在全局语义破坏下的空白,对 AI 内容安全与合规具有重要价值。
🎯 建议动作: 研究跟进
排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)