推荐 3.5
Conf: 50%
该论文提出了KYA(Know Your Agents),一个框架无关的自主系统信任与治理层,旨在解决AI智能体运行中可能出现的错误、偏离、数据泄露或恶意行为等问题。K YA由五个核心原语组成:(1) 四门入站应用管道,结合Ed25519签名验证与多锚点固定、持久时间过期、仅收紧组合以及默认操作员批准;(2) 在三级多租户层次结构(平台默认、租户覆盖、签名外部推荐)上的仅收紧组合代数;(3) KYP(Know Your Principal),一个跨人类用户、AI智能体和服务账户的统一信任评分模式;(4) 可审计的交互乘数放大,基于AIVSS形状的加性基线,带有稳定审计码的有界非对称每交互乘数;(5) 双轴委托归因,结合静态观察门控委托信任溢价与三个SDK钩子表面的零配置运行时编排器责任归属。KYA框架无关,兼容22个智能体框架。纯函数评分器p99延迟小于1毫秒,系统在20个并发工作线程下维持约1800 ops/秒,HMAC链完整性端到端保持。四门入站应用管道在所有测试中拒绝伪造、过期、宽松和未批准的推荐(1200/1200),SQLite上p99延迟小于1毫秒。KYA能检测89%的对抗性探测(来自PyRIT和Garak的1200个探测),包括最近发布的拓扑引导多智能体攻击。该系统以Apache 2.0许可证发布,作为veldt-kya包在PyPI上可用(提交时为候选版本,稳定版v0.1.0即将发布)。
💡 推荐理由: KYA为自主系统的安全治理提供了框架无关的标准化信任层,可对抗智能体漂移、数据泄露和恶意行为,对蓝队监控和治理多智能体环境具有重要意义。
🎯 建议动作: 关注研究进展,评估将KYA集成至现有智能体治理管道的可行性
排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)