该论文针对生产环境中AI代理的运行时治理问题,提出了一种五平面参考架构。传统企业安全基于数据边界防护,但AI代理通过读取上下文、调用工具、连接器和修改系统记录,将风险内化于工作流内部的行动序列中,这些序列可能组合出未授权的业务流程变更。现有策略引擎仅支持基于原子主体的请求时决策,而代理系统需要状态化评估复合主体(其权限通过委托链衰减)。论文提出的架构由四个可组合原语构成:五平面分解(意图裁决推理平面,以及网络、身份、端点、数据四个执行平面)、任意点中介、带有能力衰减的复合主体、以及作为结构化证据基础的审计。作者定义了一组六种中断原语以泛化允许/拒绝,陈述并论证了四个正确性不变量,并展示了在五个具体工作流中消除七种生产代理威胁的方法。政策引擎核心的参考实现提供了测量证据:衰减正确性和证据可重构性在每次试验中成立,裁决运行在个位数微秒级别,审计底层的防篡改行为完全符合设计。论文明确限定范围:该架构治理的是委托动作而非模型行为,下一步计划是对真实代理基准进行全面评估。适合安全架构师、AI代理开发者及策略引擎设计者阅读。
💡 推荐理由: 该架构系统解决了AI代理在生产环境中的运行时治理空白,为企业在不阻止创新的前提下管控代理行为提供了可落地的参考,对安全团队构建代理安全体系具有重要指导意义。
🎯 建议动作: 研究跟进