#multi-robot 主题 - Cyber Security Daily Radar

👥 作者: Zhen Huang, Zhihuang Liu, Mengxuan Luo, Weishang Wu, Zhiping Cai

本文研究了在大语言模型（LLM）控制的多机器人协作系统中，通过单一机器人被攻陷后传播不安全行为的安全威胁。随着LLM在具身智能中作为通用规划器的广泛应用，其在高层次协调和低层次任务规划中发挥关键作用，但同时也引入了新的安全风险：被操纵或对齐错误的指令可能转化为物理动作。已有工作主要关注单机器人场景中的此类威胁，而在多机器人协作中，通过机器人间通信传播的安全风险尚未被充分探索。为填补这一空白，作者提出了一种针对多机器人系统的新型攻击范式，攻击者仅操控系统中的单个入口机器人，被攻陷的机器人通过同伴通信传播恶意意图，导致整个系统产生协调的不安全行为。评估覆盖了高风险的三个维度：失职（dereliction of duty）、隐私侵犯（privacy compromise）和公共安全危害（public safety hazards）。实验揭示了多机器人规划器在安全对齐方面的持续缺陷。作者使用三个指标量化攻击效果：服从度（obedience）、传染性（infectiousness）和隐蔽性（stealthiness）。实验结果表明，攻击者能够实现持久控制和快速传播：在最强的攻击设置下服从度达到1.00，传染性上升至0.90；攻击效率极高，仅需平均3.0轮即可攻陷所有机器人，同时保持0.81的隐蔽性。当机器人在关键场景（如紧急情况或权利冲突）中必须解决权衡时，风险进一步放大，因为协调机制可能无意中允许对抗性指令覆盖安全要求。论文提供了开源代码。本文适合机器人安全、LLM安全及多智能体系统的研究者阅读。

💡 推荐理由: 首次系统揭示LLM控制的多机器人协作中通过单点妥协传播不安全行为的威胁，凸显了现有多机器人规划器安全对齐的严重缺陷，对工业机器人集群、自动驾驶车队等应用场景具有重要警示意义。

🎯 建议动作: 研究跟进，评估自身多机器人系统对该类传播攻击的脆弱性，并考虑在机器人间通信中引入安全校验机制。

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

#multi-robot

Propagating Unsafe Actions in LLM Controlled Multi-Robot Collaboration via Single Robot Compromise