该论文提出了Pramana,一个用于自治代理网络中的声明验证的协议层解决方案。在受监管领域中,自主代理对每个关键输出必须产生一个可审计的验证工件,记录声明内容、来源、执行者、时间和方式。当前的生产验证分为两个未标准化的方向:概率性判决模式(如自一致性投票、评审LLM集成)产生判断而非工件;而工件产生模式(如RAG、工具增强轨迹、生成器-验证器循环)产生特定于供应商的记录,外部审计员无法在不进行定制集成的情况下重构。Pramana定义了缺失的线路格式:每个关键代理输出被封装在一个类型化的ClaimAttestation中,包含四种变体(测量、推理、类比、引用),每种都配有针对记录源的verify()操作。对于测量声明和引用声明,verify()是确定性的;对于推理声明和类比声明,确定性则取决于预言机(在LLM支持下可审计重放)。这种四类分类源于古典印度认识论(pramana,有效知识的来源)。生命周期在TLA+中指定,并通过TLC在三个对称缩减模型上进行了全面验证:总共38,563个不同的可达状态,零个不变性违反。Python参考实现通过了84个测试。一个A2A和MCP的线扩展清单层叠了三个部署级不变性:可达性、SLA边界和离线可重新验证。一个探索性试点(n=100,2,275次评审调用)探讨了LLM作为代码生成中的评判者。最显著的观察是跨越语料库的40个百分点的原始FPR差异,与参考解决方案质量显著一致。该试点本身并不验证Pramana;结构论证和形式验证做到了这一点。
💡 推荐理由: 该工作为自治代理的可审计性提供了形式化协议层设计,填补了声明验证标准化的空白,对监管合规和信任建立具有重要价值。
🎯 建议动作: 研究跟进