推荐 3.5
Conf: 50%
本文针对句子级文本水印在强释义攻击下鲁棒性不足的问题展开研究。现有的句子级水印方法通过将水印锚定在句子语义上来增强对释义的鲁棒性,但基于前缀的设计仍然容易受到句子分割和合并等结构扰动的影响,这些扰动在DIPPER、GPT-3.5等强释义器下普遍存在。为此,作者提出了AliMark框架,将句子级水印重新定义为潜在水印文本与秘密比特序列之间的比特序列编码和对齐问题。具体地,AliMark采用两阶段检测策略:首先生成多个重组的文本变体,然后自适应地将提取的比特序列与秘密比特序列对齐,以最小化对齐成本。这种多候选对齐设计自然提高了对句子合并和分割的鲁棒性。大量实验表明,在多种释义攻击下,AliMark显著优于现有基线方法。该研究为提升文本水印在对抗性环境下的实用性提供了新思路。
💡 推荐理由: 该研究针对强释义攻击下句子级水印易被破坏的关键问题提出解决方案,对保护AI生成文本版权、防止内容被恶意篡改具有重要实践价值。
🎯 建议动作: 研究跟进
排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)