#feature-alignment

共收录 1 条相关安全情报。

← 返回所有主题
👥 作者: Haiyun Li, Shuhai Peng, Zhisheng Zhang, Jingran Xie, Xiaofeng Xie, Hanyang Peng, Zhiyong Wu

本文提出一种特征对齐的语音水印方法,旨在提高水印对语音重建模型(如现有或未知的编解码器)的鲁棒性。传统音频水印在保真度与鲁棒性之间存在权衡:增加水印能量可提升鲁棒性,但会降低不可感知性。作者利用预训练语音编解码器生成伪语音水印,使其分布与原始语音特征对齐,从而允许嵌入更高能量的水印而不影响感知质量。具体地,将伪水印融合到输入音频的语谱图中,并通过VAD损失和感知损失引导水印仅嵌入在有声区域。实验表明,该方法在保持与现有技术相当不可感知性的同时,在已知和未知语音重建模型下均显著提升了鲁棒性。该研究适用于对抗深度伪造语音溯源、版权保护等场景。

💡 推荐理由: 为音频水印的实用化提供新思路,可抵抗语音重编码攻击,对深度伪造检测与溯源有直接帮助。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)