#transparency-log 主题 - Cyber Security Daily Radar

👥 作者: Faruk Alpay, Baris Basaran

该论文针对硬件性能测试报告的可信度问题提出了一种自验证的测量记录方法。当前硬件基准测试结果通常依赖读者信任，但实际中可能存在硬件错误（例如每千个核心中约有一个返回无错误提示的错误算术结果）。作者构建了一种防篡改、可独立验证的测量记录结构：论文中每个文本、表格或图表中的数值通过其内容哈希绑定到对应的观测和验证过程；整个记录构成一个哈希链接的仅追加结构（测量透明度日志），验证者无需信任生产者即可离线审计。对于矩阵乘积等运算，采用概率性身份验证（Freivalds算法），在浮点误差分析推导的容差范围内以O(k n^2)成本进行检验，错误乘积被拒绝的概率为1-2^{-k}；其他无法进行此类验证的量则附带代数校验和以及可重复性类别。进一步将检查本身视为安全对象：承诺用于离线可重复性的探针种子构成攻击面，而探针感知的对手可以在探针的零空间中隐藏破坏，甚至欺骗大多数位相同的见证者；通过从声称输出派生的Fiat-Shamir挑战可消除此漏洞。实验表明，从未授权租户的访问层面使用di/dt功率病毒和热浸泡驱动设备，既不会改变校准容差也不会产生静默错误，从而将物理故障威胁限定在罕见缺陷部件或特权攻击者，并标记了记录必须与硬件信任根组合的边界。作者在Blackwell和Hopper GPU上演示了该构造，并报告了不同精度、规模和设备下的残差底限和可重复性映射。

💡 推荐理由: 为硬件基准测试提供了可独立验证、防篡改的审计机制，有助于提升对硬件性能声明的信任，尤其对涉及安全关键或合规场景的硬件采购与评估具有参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Juan Figuera

当前人工智能代理的可观测性存在结构性缺陷：生成活动日志的实体与日志所记录的活动实体是同一个。因此，一个被攻陷或存在缺陷的代理可以省略、篡改甚至伪造自身的操作记录，而运行该代理的操作员无法独立检测到任何篡改行为。本文提出了一类新颖的协议族，通过反转信任边界解决了该问题：接收代理调用的服务（即接收方）使用自己的密钥对观察到的内容签署一份“收据”，并将收据加密发送给代理的所有者，同时发布到公共透明度日志中。所有者无需信任代理或其操作员即可重建一个防篡改的操作踪迹。作者将此类协议实例化为Sello协议，该协议结合了现有系统中均不存在的四个属性：（P1）接收方签名；（P2）使用HPKE加密到所有者公钥，并通过JWS将公钥与授权令牌绑定；（P3）发布到见证者联合签名的Merkle日志；（P4）所有者通过令牌引用发现并获取收据。论文详细描述了协议流程，分析了在对手同时控制代理及其操作员情况下的安全性，给出了密码学操作的微基准测试，并将Sello与相邻的收据协议（如Signet、AgentROA、Agent Passport System、draft-farley-acta、SCITT）进行了比较。最后讨论了已知的局限，包括压制攻击、服务合谋以及采用激励问题。本文适合关注AI代理安全、可审计性及分布式信任基础设施的研究人员和工程师阅读。

💡 推荐理由: 本文解决了AI代理自审计日志的信任依赖问题，填补了现有系统中接收方签名的缺失，为构建真实可信的代理操作溯源提供了密码学基础。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

Cyber Security Daily Radar

#transparency-log

Self-Verifying Measurement Records: Hash-Linked Evidence Graphs for Hardware Benchmarking

Notarized Agents: Receiver-Attested Confidential Receipts for AI Agent Actions