#vla 主题 - Cyber Security Daily Radar

👥 作者: Tuan Duong Trinh, Naveed Akhtar, Basim Azam

本研究探讨了在视觉-语言-动作（VLA）模型中添加推理步骤对模型鲁棒性的影响。直觉上，先推理后行动的策略应能更好地吸收输入扰动，但本文通过实验验证了这一假设。作者选取了三种代表不同推理水平的模型：无推理、文本链式推理（CoT）以及潜在迭代循环推理，在LIBERO和SimplerEnv环境中对模型的视觉、推理和动作阶段分别施加随机噪声和白盒攻击。实验围绕两个核心问题展开：推理设计是否改变鲁棒性？以及推理输出是否可在运行时作为安全信号使用？结果显示，潜在迭代模型是最不鲁棒的：在两种扰动下其任务成功率急剧下降，而其他两种模型则保持了鲁棒性。进一步分析表明，这种脆弱性是结构性的，而不是累积的；改变推理深度对鲁棒性影响甚微。尽管原则上可以监控推理输出，但在公平测试条件下监控器失效。一种看似完美的计划-动作一致性探测在自适应攻击下表现如随机猜测。在匹配假阳性率校准下，将一致性探测与动作异常探测融合，并未能将防御成功率提升至未防御水平之上。此项研究强调了在VLA模型安全评估中需要考虑推理阶段引入的脆弱性，并为未来防御设计提供了重要前提。

💡 推荐理由: 该研究揭示了在VLA模型中增加推理步骤可能引入严重的安全隐患，尤其是潜在迭代推理架构。它挑战了‘先推理后行动更能抵御扰动’的直觉，对机器人安全、自动驾驶等依赖VLA模型的应用具有警示意义。

🎯 建议动作: 研究跟进，建议关注VLA模型推理阶段的安全评估和防御方法。

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Xukun Luan, Jinyan Liu, Xuesong Li, Yuanguo Bi, Renjun Wu, Zhongxiang Lei, Di Wang

本文首次系统性地研究了视觉-语言-动作（VLA）模型在会员推断攻击（MIA）下的隐私脆弱性。VLA模型通过融合视觉、语言和动作信号实现端到端机器人控制，但训练数据的高昂采集成本使得数据记忆引发的隐私泄露和知识产权侵权问题尤为突出。会员推断攻击旨在判定给定样本是否属于训练集，然而现有研究尚未涉及VLA模型。为此，作者提出了VLALeaks攻击框架，利用VLA模型中注意力机制的差异进行攻击。该方法分为两个阶段：首先提取会员特征，即通过分析模型在不同输入上的注意力分布差异来捕捉会员信息；然后构建攻击模型，通过二分类器判断样本是否属于训练集。在多个VLA基准数据集上的实验表明，VLALeaks能够有效揭示会员信息，并在AUC和TPR@1%FPR指标上达到最优性能，充分暴露了当前VLA模型部署中的隐私隐患。该工作为构建安全可信的VLA模型提供了重要洞察。

💡 推荐理由: VLA模型正广泛应用于机器人控制，数据隐私泄漏将导致商业秘密和用户数据暴露。本研究首次揭示VLA模型的会员推断风险，对保障机器人系统数据安全至关重要。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Jianwei Tai

本文从部署安全角度审视视觉-语言-动作（VLA）策略，指出当前将VLA策略视为仅由权重、提示和基准测试定义的对象这一假设存在缺陷。实际上，相同的归一化模型输出在经历动作反归一化和控制器约定后，会转化为不同的物理动作，导致安全审查仅能验证模型检查点而遗漏实际执行策略。作者将这一问题形式化为“可执行策略规范”问题：VLA策略包括学习模型、动作表示、元数据选择的归一化器以及控制器约定。在相同检查点下，这些因素可能导致执行不等效。针对分位式动作归一化，作者推导了元数据不匹配变换的闭式解，并设计了ExecSpec证书，无需推理或实际部署即可度量动作空间语义漂移。在LIBERO-Goal数据集上，替换一个看似合理的兄弟元数据键导致六个非夹持器动作维度的平均漂移为0.199，完全替换后成功率从28/28降至2/28；在LIBERO-Spatial上，相同替换使成功率从26/26降至0/26。所有四个物体替换任务的完全替换均导致0/28成功率，长时任务则降至0/23或1/23。通过身份键、回放有效性、无操作过滤、原始与校正回放、掩码/夹持器、合成上界以及OpenVLA风格归一化器接口检查，排除了多种简单解释。结果表明，动作空间元数据是可执行策略的组成部分，应在实际部署前进行检查。注意，这些结果不认证闭环或硬件安全，仅支持更窄的部署安全观点。

💡 推荐理由: 本文揭示了VLA策略部署中的一个关键安全盲点：相同的模型权重可能因元数据配置不当导致完全不同的物理行为，从而引发安全风险。安全从业者应意识到策略检查不能仅停留在模型层面，还需验证动作归一化参数和控制器约定。

🎯 建议动作: 研究跟进：建议VLA策略部署前对动作归一化元数据进行一致性校验，并引入ExecSpec证书作为预检手段。

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Mohammadreza Teymoorianfard, Jean-Philippe Monteuuis, Jonathan Petit, Amir Houmansadr

该论文首次系统性地研究了具有推理能力的视觉-语言-动作（VLA）模型在自动驾驶场景下对现实输入扰动的鲁棒性。以往研究多假设推理与轨迹生成紧密耦合且鲁棒，但实际场景中存在各种文本输入噪声（如传感器错误、环境描述歧义等）。作者以NVIDIA最新提出的Alpamayo系列模型为代表性VLA框架，在黑盒设定下模拟了多种现实文本扰动，包括字符级错误、单词级替换、语义混淆等。实验采用闭环仿真环境（如CARLA），评估扰动对模型推理正确性和轨迹规划的影响。结果表明：攻击对推理环节的成功率高达89%，对最终轨迹操纵的成功率达72%，显著增加碰撞率并降低安全指标。为系统评估这种脆弱性，论文设计了推理感知评估框架，同时关注推理的语义一致性（如哪类指令被错误理解）和结构准确性（如动作序列的顺序错误），并引入安全中心度量（如最小安全距离违反次数）。此外，作者公开了一个基准测试集，涵盖不同类型的扰动与场景，用于标准化评估攻击与防御方法。该工作指出当前VLA模型缺乏对输入噪声的鲁棒性，亟需开发新的防御机制以确保L4级以上自动驾驶的安全性。

💡 推荐理由: 自动驾驶安全是硬约束，而本文揭示VLA模型在输入扰动下推理与轨迹双失效，威胁行车安全。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Jianwei Tai

该论文研究了视觉-语言-动作（VLA）模型在机器人部署中的能力与鲁棒性之间的理论权衡。VLA模型在干净输入上表现出高成功率（如OpenVLA-7B在LIBERO基准上超过95%），但在微小对抗扰动下性能急剧下降（例如16/255的PGD攻击使成功率降至5%以下）。现有经验性防御方法虽能恢复部分鲁棒性，但会牺牲干净准确率，且缺乏理论下界。作者通过信息论方法证明了：对于任何离散动作的VLA策略，能力（策略动作与理想动作的互信息）与鲁棒性（对抗扰动下保留的互信息，扣除平凡信道泄露）之和受限于一个与策略无关的预算：任务熵加对抗信道容量。该证明基于数据处理不等式和互信息非负性。像素级界限与策略无关但较松（约10^3 nats）；而编码器特定推论可在每个实验上收紧到约86-156 nats（在OpenVLA上，epsilon=8/255时）。作者在252个闭式高斯VLA单元和48个OpenVLA-7B×LIBERO×PGD单元上验证了该界限，零违反。编码器界限还诊断了防御在信道中的干预位置：输入侧防御（JPEG-50）将编码器预算移动+41到+101 nats（epsilon∈{2,4,8,16}/255时），而LLM侧防御（rank-16 LoRA）移动不超过9%（epsilon=8/255时仅0.7%）。论文建议将编码器特定松弛作为与原始鲁棒性并行的诊断轴，并开源了所有代码和结果。

💡 推荐理由: VLA模型直接控制物理机器人，对抗攻击可造成实际安全风险。该理论界限揭示了能力与鲁棒性的固有矛盾，为设计更可靠的机器人策略提供了理论基础，帮助防御者理解现有防御方法的局限性。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

Cyber Security Daily Radar

#vla

Reasoning as a Double-Edged Sword: Architecture and Cross-Stage Robustness in Vision-Language-Action Models

VLALeaks: Membership Inference Attacks against Vision-Language-Action Models

Same Weights, Different Robot: A Deployment Safety View of VLA Policies

ReasonBreak: Probing Vulnerabilities in Reasoning-Enabled Vision-Language-Action Models for Autonomous Driving

Capability and Robustness Cannot Both Be Free: An Information-Theoretic Bound for Vision-Language-Action Models