本文从部署安全角度审视视觉-语言-动作(VLA)策略,指出当前将VLA策略视为仅由权重、提示和基准测试定义的对象这一假设存在缺陷。实际上,相同的归一化模型输出在经历动作反归一化和控制器约定后,会转化为不同的物理动作,导致安全审查仅能验证模型检查点而遗漏实际执行策略。作者将这一问题形式化为“可执行策略规范”问题:VLA策略包括学习模型、动作表示、元数据选择的归一化器以及控制器约定。在相同检查点下,这些因素可能导致执行不等效。针对分位式动作归一化,作者推导了元数据不匹配变换的闭式解,并设计了ExecSpec证书,无需推理或实际部署即可度量动作空间语义漂移。在LIBERO-Goal数据集上,替换一个看似合理的兄弟元数据键导致六个非夹持器动作维度的平均漂移为0.199,完全替换后成功率从28/28降至2/28;在LIBERO-Spatial上,相同替换使成功率从26/26降至0/26。所有四个物体替换任务的完全替换均导致0/28成功率,长时任务则降至0/23或1/23。通过身份键、回放有效性、无操作过滤、原始与校正回放、掩码/夹持器、合成上界以及OpenVLA风格归一化器接口检查,排除了多种简单解释。结果表明,动作空间元数据是可执行策略的组成部分,应在实际部署前进行检查。注意,这些结果不认证闭环或硬件安全,仅支持更窄的部署安全观点。
💡 推荐理由: 本文揭示了VLA策略部署中的一个关键安全盲点:相同的模型权重可能因元数据配置不当导致完全不同的物理行为,从而引发安全风险。安全从业者应意识到策略检查不能仅停留在模型层面,还需验证动作归一化参数和控制器约定。
🎯 建议动作: 研究跟进:建议VLA策略部署前对动作归一化元数据进行一致性校验,并引入ExecSpec证书作为预检手段。