#transparency-log

共收录 1 条相关安全情报。

← 返回所有主题
👥 作者: Juan Figuera

当前人工智能代理的可观测性存在结构性缺陷:生成活动日志的实体与日志所记录的活动实体是同一个。因此,一个被攻陷或存在缺陷的代理可以省略、篡改甚至伪造自身的操作记录,而运行该代理的操作员无法独立检测到任何篡改行为。本文提出了一类新颖的协议族,通过反转信任边界解决了该问题:接收代理调用的服务(即接收方)使用自己的密钥对观察到的内容签署一份“收据”,并将收据加密发送给代理的所有者,同时发布到公共透明度日志中。所有者无需信任代理或其操作员即可重建一个防篡改的操作踪迹。作者将此类协议实例化为Sello协议,该协议结合了现有系统中均不存在的四个属性:(P1)接收方签名;(P2)使用HPKE加密到所有者公钥,并通过JWS将公钥与授权令牌绑定;(P3)发布到见证者联合签名的Merkle日志;(P4)所有者通过令牌引用发现并获取收据。论文详细描述了协议流程,分析了在对手同时控制代理及其操作员情况下的安全性,给出了密码学操作的微基准测试,并将Sello与相邻的收据协议(如Signet、AgentROA、Agent Passport System、draft-farley-acta、SCITT)进行了比较。最后讨论了已知的局限,包括压制攻击、服务合谋以及采用激励问题。本文适合关注AI代理安全、可审计性及分布式信任基础设施的研究人员和工程师阅读。

💡 推荐理由: 本文解决了AI代理自审计日志的信任依赖问题,填补了现有系统中接收方签名的缺失,为构建真实可信的代理操作溯源提供了密码学基础。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)