#amr

共收录 1 条相关安全情报。

← 返回所有主题
👥 作者: Ziping Ye, Gourab Dey, Christos Christodoulopoulos, Charith Peris, Anil Ramakrishna, Weitong Ruan, Aram Galstyan, Kai-Wei Chang, Rahul Gupta, Ninareh Mehrabi

SWAN(语义水印与抽象语义表示)是一种新颖的文本水印框架,它利用抽象语义表示(AMR)将水印签名直接嵌入句子的语义结构中。与现有方法在文本生成过程中通过调整令牌选择偏好来编码签名不同,SWAN将签名编码在语义表示层面,因此任何保留语义的释义都会自动保留签名。该框架无需训练:水印注入通过提示大型语言模型(LLM)在保持上下文连贯性的同时,根据选定的AMR模板生成句子来实现;检测则使用现成的AMR解析器,随后进行简单的单比例z检验。在RealNews基准上的实证评估表明,SWAN在未修改的水印文本上达到了与最先进方法相当的检测性能,同时在抵御释义攻击方面显著提升了鲁棒性,与先前方法相比,检测AUC最多提高了13.9个百分点。这些结果证明,SWAN将水印锚定在AMR语义结构中的方法提供了一种简单、有效且基于提示的文本来源验证手段,在释义场景下表现稳健,为语义级水印研究开辟了新途径。

💡 推荐理由: SWAN提出了首个基于AMR语义结构的水印方法,无需训练即可嵌入水印,且对释义攻击具有强鲁棒性,可应用于生成文本的版权保护和来源追踪。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)