推荐 8.5
Conf: 50%
自动语音识别(ASR)系统对对抗性和良性扰动高度敏感,但现有检测方法因缺乏真实转录的先验知识而难以在部署系统中实施。本文提出一种基于认证思想的鲁棒性增强方法,通过双门控诊断管道提升系统可靠性。该管道包含两个核心模块:一是“两侧原子审计”,通过累积统计证据来认证令牌的存在和对抗性排除;二是“基于排名的竞赛”,从候选序列中选择获胜转录。在四种不同架构(如DeepSpeech、QuartzNet等)上的实验表明,该方法能使词错误率相对降低高达55%,同时提供细粒度的单词级和句子级鲁棒性认证。该工作为ASR系统的声学安全性提供了一种可证明的保障机制,有助于在真实场景中抵御扰动。
💡 推荐理由: 该研究为ASR系统提供了一种可认证的鲁棒性增强方法,显著降低词错误率,解决了部署环境中无法获得真实转录的检测难题,对提升语音交互系统的安全性具有重要意义。
🎯 建议动作: 研究跟进
排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)