推荐 3.5
Conf: 50%
本文针对家用机器人操作中的排版攻击(typographic attack)进行了系统研究。开放词汇的具身AI代理(如基于CLIP的视觉语言模型)在物体感知和任务接地中越来越依赖视觉-语言模型,然而共享的嵌入空间引入了一种结构性脆弱性:物理场景中打印的文本(如对抗性贴纸)可以语义覆盖视觉判断,导致模型对物体的错误识别。先前工作仅在静态2D基准和3D导航任务中量化了这种威胁,但尚未探索其对完整的“感知-规划-执行”流水线(Sense-Plan-Act)的影响,尤其是在家用机器人操作场景中。本文在Habitat模拟环境中,基于HomeRobot基准进行了评估。作者提出了一种解耦的感知架构,将冻结的CLIP编码器暴露给对抗性贴纸,同时通过DETIC保持几何接地。在包含59个可归因片段的受控评估池中,攻击在未进行感知优化、视角和遮挡不受控制的情况下,达到了67.8%的总体攻击成功率(ASR),在完全成功的片段中上升到70.0%。关键发现是:感知错误通过持久3D语义地图传播,产生了动力学失效——即机器人物理执行了错误的抓取和运输动作,将错误物体送到目标容器。这些结果证明了排版误分类是对模块化操作管道安全的真实、可测量且具有物理后果的威胁,而这在之前的排版攻击研究中未被探讨。本文适合机器人安全、AI安全及具身AI领域的研究人员和工程师阅读。
💡 推荐理由: 首次在完整的家用机器人操作流水线中证明排版攻击可造成物理后果(抓取错误物体),为具身AI安全评估提供了新场景。
🎯 建议动作: 研究跟进
排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)