#systems-security 主题 - Cyber Security Daily Radar

👥 作者: Mihai Christodorescu, Earlence Fernandes, Ashish Hooda, Somesh Jha, Johann Rehberger, Kamalika Chaudhuri, Xiaohan Fu, Khawaja Shams, Guy Amir, Jihye Choi, Sarthak Choudhary, Nils Palumbo, Andrey Labunets, Nishit V. Pandya

该论文提出，智能体（agent）的安全性必须被当作一个系统问题来处理，而不仅仅依赖AI模型本身的鲁棒性。作者认为，驱动智能体的AI模型应当被视为不可信组件，安全不变性必须在系统层面强制实施。当前社区主流观点侧重于提升模型鲁棒性，但这远远不够；必须补充系统安全领域的技术。基于作者在操作系统、网络、形式化方法和对抗机器学习等网络安全研究方面的经验，他们阐述了一套核心原则，这些原则根植于数十年的系统安全研究，为设计具有可预测保障的智能体系统提供了基础。作为证据，他们分析了11个有代表性的真实世界智能体攻击案例，并讨论了如何通过落实系统原则来预防这些攻击。最后，论文指出了在智能体中实现这些原则所面临的研究挑战。适合安全研究人员、系统架构师和AI安全从业者阅读。

💡 推荐理由: 本文从根本上挑战了当前AI安全领域以模型为中心的主流视角，呼吁将系统安全方法引入智能体防护，为构建更可信的自主代理提供了新方向。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

#systems-security

Agent Security is a Systems Problem