本文提出 MIRAGE 框架,用于系统性地发现针对自动驾驶在线高清地图构建的语义攻击。自动驾驶车辆依赖高清地图感知车道线、分隔带、人行横道等安全关键元素,现有像素扰动攻击易被标准对抗防御(如对抗训练)中和。MIRAGE 利用扩散模型学习到的真实数据潜流形,搜索与真实场景具有相同道路拓扑但能误导地图预测的语义突变场景,例如阴影、湿滑路面等合法环境变化。在 nuScenes 数据集上评估了两种攻击:边界移除攻击抑制 57.7% 的检测结果,导致 96% 的规划轨迹被破坏;边界注入攻击是唯一能成功注入虚拟边界的方法,而像素级 PGD 和 AdvPatch 完全失败。两种攻击在多种对抗防御下仍保持有效性。通过两个独立 VLM 评判员量化真实感,MIRAGE 生成场景有 80–84% 的概率被认为真实(干净 nuScenes 为 97–99%,AdvPatch 仅 0–9%)。实验表明,语义级扰动作为合法的环境变化,比像素级扰动更难防御,揭示了当前对抗防御的类别性缺陷。
💡 推荐理由: 揭示了语义级环境扰动可绕过现有对抗防御,严重威胁自动驾驶地图感知安全,迫使防御机制从像素级转向语义级。
🎯 建议动作: 建议自动驾驶安全团队评估地图感知模块对语义扰动的鲁棒性,并探索基于扩散模型或物理仿真的对抗训练方法。