#accountability 主题 - Cyber Security Daily Radar

👥 作者: Yifan He, Zhiguang Shan, Le Luo, Wei Wang

本文研究AI代理身份系统中问责性与匿名性的平衡问题。现有行业实践和研究方案普遍倾向于让每个代理完全可识别以保障问责，但中国正在建设的国家级代理身份层（计划于2026年Q3公开上线）探索了一条不同路径：代理与经过验证的法律主体关联，但该主体身份不向任何业务层参与者披露；只有通过法律程序分别强制两个不同的政府机构才能重新识别，且任一机构单独无法完成。作者将这一机制命名为“分裂知识绑定”（split-knowledge binding），并坦承它是条件性的——分离是结构性和程序性的，而非密码学层面的；若国家同时强制两个机构，则可重新识别。论文贡献了五个方面：(1) 分裂知识绑定，一种基于机构而非密码学分离的托管问责机制；(2) 事后归因论（ex-post attribution thesis），主张只有基于归因的问责才能对AI代理具有法律后果的行为产生法律效力；(3) 问责面（accountability surface），一个设计概念，标识哪些代理行为会留下身份痕迹；(4) 身份托管比例框架（proportionality framework for identity escrow），在三种信任架构中选择的决策结构；(5) 反思性管辖方法（reflexive jurisdiction method），用于评估本文自身部署的标准。系统证明了国家级可行性；该框架是评判任何部署（包括本文所述系统）的工具。

💡 推荐理由: 该研究为AI代理的问责与匿名提供了全新的机构级设计范式，对构建可信AI代理基础设施具有重要参考价值，尤其适用于需要兼顾隐私与法律追责的场景。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Pierre Civit, Daniel Collins 0001, Vincent Gramoli, Rachid Guerraoui, Jovan Komatovic, Manuel Vidigueira, Pouriya Zarbafian

本文提出了一种可扩展的可问责拜占庭协议（Scalable Accountable Byzantine Agreement, SABA），解决了传统拜占庭协议在参与方数量增加时通信开销过高的问题。SABA 能够在线性时间内完成协议，且不需要认证通道或公钥基础设施（PKI），仅依赖异步网络模型。核心方法包括：利用可问责的故障检测机制，在协议执行结束后识别并证明拜占庭节点的行为；通过分片和随机抽样技术，将计算和通信复杂度从 O(n^2) 降低到 O(n)。论文进一步展示了如何将 SABA 用于构建可问责的原子广播（Accountable Atomic Broadcast），并探讨了在区块链共识（如 HotStuff）中的应用。实验证明，在 1000 个节点的规模下，SABA 的延迟和消息复杂度均远低于现有方案。主要贡献包括：首次实现线性复杂度的可问责拜占庭协议；提出一种通用的可问责故障检测框架；展示了可问责性如何提升分布式系统的安全性和可审计性。该研究适用于需要高容错性和可追踪性的分布式系统，如联盟链、跨链通信和关键基础设施。

💡 推荐理由: 可问责的拜占庭协议能识别并证明恶意节点，对提升区块链和分布式系统的安全性、审计能力至关重要。本文提出的线性扩展方案填补了该领域效率瓶颈，有望推动大规模可问责共识的应用。

🎯 建议动作: 研究跟进，评估在联盟链或许可链中集成可问责拜占庭协议的可能性。

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Sebastian Cochinescu

本文提出 ECO/CPO-DAG，一个针对对抗性供应链的问责协议，将矛盾检测形式化为补充验证层，而非共识或真理建立机制。参与者将签名的事件声明对象（ECO）发布到一个因果有序、只追加的有向无环图（DAG）中，边编码了发生在先关系。当关于同一主体的两个声明违反领域约束时，任何观察者可以编译一个矛盾证明对象（CPO），这是一个自验证对象，绑定两个签名声明和违反的规则，公开验证后触发对确定责任方的经济惩罚。协议将约束映射到 GS1 EPCIS 2.0 事件语义（空间唯一性、时间单调性、数量守恒、质量单调性、监管有效性），从而检测实际有意义的矛盾。通过承诺方案和可选的零知识矛盾证明进行选择性披露，允许各方在挑战触发最小披露前隐瞒声明内容。论文给出了分析处理：独立观察者检测模型 1-(1-p_min)^h，k 方共谋下的威慑条件 S>g(1-p)/(kp)，以及假设条件下每个参与者每年约 1 GB 的存储估计。协议边界明确：它检测可证明的矛盾，而非一致的谎言；从不自相矛盾的一方对其不可见，因此该层补充而非替代源验证和预言机聚合。单机参考实现验证了检测模型，预测的覆盖范围与每个观察者数量下测量的 95% 置信区间重叠，且记录零误报；完全零知识 CPO、多方传播和自适应对手规避仍为分析性。

💡 推荐理由: 该协议为供应链场景提供了一种不依赖共识的轻量级矛盾检测机制，能经济惩罚作弊方，有望增强供应链数据完整性。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Hidde Lycklama, Alexander Viand, Nicolas Küchler, Christian Knabenhans, Anwar Hithnawi

本文针对隐私保护机器学习（PPML）与机器学习审计这两个此前大多独立研究的领域进行了交叉探索。随着PPML技术（如安全多方计算、同态加密、差分隐私等）的发展，使得对高度敏感数据（例如医疗、金融记录）进行机器学习分析成为可能，然而严格的隐私法规（如GDPR）要求对数据使用做出解释和问责，因此对PPML系统进行审计的需求日益增长。现有PPML方案缺乏透明度，难以验证计算中使用的输入数据是否与用户承诺一致，且审计过程本身可能泄露隐私。为此，作者提出了Arc——一个用于审计隐私保护机器学习的MPC（安全多方计算）框架。Arc的核心是一个新的高效协议，能够在大规模下通过简洁的承诺（succinct commitments）验证MPC输入的一致性。具体而言，该协议允许审计方在不获取原始数据的前提下，确认每个参与方提供的输入与其先前提交的承诺匹配，从而确保数据完整性。作者将该一致性协议与基于哈希和基于同态承诺的方法进行了性能对比，实验表明，Arc在速度上最高可快10^4倍，在通信简洁性上最高可优10^6倍。该工作为构建可问责、可审计的PPML系统迈出了重要一步，适用于需要既保护隐私又符合监管要求的场景。

💡 推荐理由: 首次将PPML与ML审计深度结合，提出了可扩展的输入一致性验证协议，为敏感数据领域的合规分析和透明度提供了技术基础。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.6)

👥 作者: Ruben Chocron, Doron Jonathan Ben Chayim, Eyal Lenga, Gilad Gressel, Alina Oprea, Yisroel Mirsky

该论文首次正式提出了AI代理（AI Agent）的归属问题（agent attribution）：即如何将一个观察到的有害代理交互行为追溯到其部署账户（托管供应商）。当前AI代理被广泛部署以自主执行任务，但缺乏有效的追踪机制，导致良性操作者可能因配置错误造成无意的损害，而恶意操作者（如国家行为体）则可能利用代理进行诈骗、骚扰或网络攻击。即使是最复杂的攻击者，其代理通常也依赖于供应商托管的模型，因此受影响方能够观察到代理行为，却无法通知责任操作者、终止会话或识别调查账户。论文设计了一种基于金丝雀（canary）的实用协议：授权方在代理交互流中注入金丝雀信息，供应商随后在狭窄时间窗口内的会话日志中搜索，以恢复原始会话和账户。在非对抗场景下，简单的金丝雀即可有效。对于可能过滤或改写输入内容的对抗性操作者，论文开发了鲁棒的金丝雀构造，这些构造无法在不降低代理自身任务性能的情况下被抑制，从而在防御者一侧形成了形式上的不对称优势。论文通过多种场景（包括真实世界代理）的评估，证明了该归因方法可靠、鲁棒且可扩展，适用于供应商端部署。

💡 推荐理由: 该工作填补了AI代理问责机制的关键空白，为安全团队提供了一种实际可行的追踪恶意代理源头的协议，有助于遏制滥用并推动代理生态的可信发展。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Zhi Lu, Yongquan Cui, Songfeng Lu

本文提出了一种名为 WhiteCloak 的协议，旨在解决联邦学习安全聚合场景下匿名恶意客户端的问责问题。在安全聚合中，客户端数据通过加密手段聚合，保护了用户隐私，但也使得恶意客户端可以匿名破坏模型而不被追责。WhiteCloak 通过一种可验证的匿名身份绑定机制，在聚合过程中为每个客户端生成唯一但匿名的凭证，使得服务器在聚合后能够识别并排除恶意客户端，同时不泄露其真实身份。该协议结合了密码学承诺、零知识证明和可追溯签名，实现了隐私保护与问责性的平衡。实验表明，WhiteCloak 在额外计算开销可接受的前提下，有效提升了联邦学习系统的安全性。

💡 推荐理由: 联邦学习的安全聚合面临匿名恶意攻击的盲区，WhiteCloak 首次在保持隐私的同时实现了有效问责，对提升实际部署系统的鲁棒性有重要参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.6)

Cyber Security Daily Radar

#accountability

Accountable yet Anonymous AI Agents - Split-Knowledge Binding in National Agent-Identity Layer in China

Scalable Accountable Byzantine Agreement and Beyond.

ECO/CPO-DAG: A Contradiction-Based Accountability Layer for Adversarial Supply Chains

Holding Secrets Accountable: Auditing Privacy-Preserving Machine Learning.

Who Owns This Agent? Tracing AI Agents Back to Their Owners

WhiteCloak: How to Hold Anonymous Malicious Clients Accountable in Secure Aggregation?