推荐 3.5
Conf: 50%
本文针对语音匿名化系统中个体说话人的再识别风险进行了大规模逐说话人分析。现有评估通常使用等错误率(EER)等平均指标,但这些指标可能掩盖不同个体之间再识别风险的巨大差异。作者采用基于可链接性(linkability)的度量,在最坏场景下对近5000名说话人进行评估,涵盖多种匿名化系统、攻击者架构和对话长度。研究发现,可链接性分数在说话人层面高度极化,但易于识别和难以识别的说话人集合在不同配置下差异显著。进一步分析表明,没有单一因素能够解释说话人的脆弱性,再识别风险源于攻击者、匿名化器和可用语音量之间的交互作用。这些结果挑战了“内在说话人级隐私风险”的概念,并强调评估协议必须明确基于攻击者和匿名化器进行条件设定。实验涉及多种匿名化方法(如语音转换、波形编辑)和攻击者模型(如基于x-vector的说话人识别系统),证实了隐私风险的复杂性和情境依赖性。本文的主要贡献在于:(1) 首次大规模逐说话人分析揭示隐私风险的个体差异和情境依赖性;(2) 证明平均指标不足以评估实际隐私保护效果;(3) 提出评估协议需按攻击者和匿名化器条件化的必要性。适合语音隐私研究人员、安全工程师及隐私保护技术开发者阅读。
💡 推荐理由: 揭示了语音匿名化中个体隐私风险的巨大差异,挑战了基于平均指标的评估方法,对设计更有效的语音隐私保护方案和评估标准具有重要指导意义。
🎯 建议动作: 研究跟进
排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)