#ai-governance 主题 - Cyber Security Daily Radar

👥 作者: Jonathan Shelby

本文探讨了受监管金融机构在快速采纳人工智能（AI）过程中所产生的治理与运营韧性之间的结构性缺口。当前，以欧盟AI法案、ISO IEC 42001、NIST AI风险管理框架及英国原则性方法为代表的治理体系主要围绕可信赖性（trustworthiness）展开，重点关注安全性、公平性、透明度和模型风险。然而，这种治理响应未能充分覆盖运营韧性（operational resilience），即关键业务服务在严重但可信的中断下保持连续性的能力，包括AI组件的可替代性以及对少数前沿模型供应商的依赖集中度问题。作者指出，AI的采用创造了一种独特的韧性义务，这独立于且未被可信AI堆栈充分覆盖。英国金融当局已通过金融政策委员会的系统性分析、关键第三方制度以及2026年5月关于前沿AI与网络韧性的联合声明开始弥合这一差距。本文映射了两种监管逻辑（可信AI与运营韧性），识别出它们之间的结构缺口，并提出了AI韧性框架（AI Resilience Framework）。该框架是一种与具体监管制度无关的方法，通过依赖映射、关键性-可替代性分层、将冲击容忍度扩展到AI特定故障模式、明确的回退原则以及供应商层面的集中度管理，将AI依赖关系纳入运营韧性边界。该框架为首席信息安全官、安全架构师和董事会提供了从AI治理政策到可证明韧性的可行路径。本文是作者关于英国网络韧性监管框架在人工智能维度分析的延续。研究指出，组织应当针对AI系统建立独立的韧性评估与测试机制，避免将AI治理等同于整体韧性。

💡 推荐理由: 填补了现有AI治理框架（如欧盟AI法案）在运营韧性方面的空白，为金融机构应对AI供应链集中风险、第三方依赖及系统级中断提供了可落地的框架。

🎯 建议动作: 研究跟进：建议安全架构师与风险管理团队评估AI韧性框架在本组织的适用性，尤其是依赖映射与供应商集中度管理。

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)

👥 作者: Javier Irigoyen, Roberto Daza, Aythami Morales, Julian Fierrez, Ruben Tolosana, Ruben Vera-Rodriguez, Francisco Jurado, Alvaro Ortigosa

本文综述了人工智能系统风险识别、分析与管理的系统性方法论。首先，梳理了全球范围内推动AI风险评估需求的监管格局，包括欧盟《人工智能法案》等基于风险的监管框架。其次，系统分类了文献中识别的AI相关风险谱系，涵盖从技术故障（如模型鲁棒性不足、数据泄露）到伦理与社会影响（如歧视、隐私侵犯、可解释性缺失）的多种维度。随后，重点回顾了面向AI系统的主流风险评估方法论，聚焦于通用框架（如NIST AI风险管理框架、ISO/IEC 42001等），分析了各框架的核心步骤、适用场景及优缺点。论文指出了当前AI风险评估中的最佳实践，例如分层评估、持续监控与多方利益相关者参与，同时揭示了方法论缺口（例如动态风险适应、因果关系量化、人机协作场景的特殊评估需求）。最后提出了未来研究方向，包括风险指标的标准化、跨领域迁移能力、以及与大模型风险特性匹配的评估技术。本文适合AI安全工程师、风险合规人员、政策制定者及研究人员阅读，以系统理解AI风险评估的现状与挑战。

💡 推荐理由: 随着欧盟《人工智能法案》等监管落地，系统性AI风险评估成为刚需。本文提供了当前方法论的全景图，帮助组织在合规和风险管控中少走弯路。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Tian Dong, Shaofeng Li 0001, Guoxing Chen, Minhui Xue 0001, Haojin Zhu, Zhen Liu 0008

该论文《RAI2: Responsible Identity Audit Governing the Artificial Intelligence》由Tian Dong等人撰写，旨在解决人工智能系统中的身份审计与治理问题。虽然摘要内容未提供，但根据标题推测，论文可能提出了一种负责任的身份审计框架（RAI2），用于监管AI系统的身份管理、访问控制和合规性审计。该方法可能结合了身份与访问管理（IAM）技术和AI模型审计策略，以增强AI系统的安全性和可问责性。由于缺乏具体细节，无法进一步描述技术架构及实验验证。

💡 推荐理由: 随着AI系统在企业中的广泛部署，身份审计与治理成为确保AI安全合规的关键。该论文可能提供创新的审计框架，帮助安全团队建立对AI身份行为的可视性和管控。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.3)

👥 作者: Anna Ablove, Shreyas Chandrashekaran, Xiao Qiang, Roya Ensafi

本文系统地研究了中文大型语言模型（LLM）服务中内容审查政策的实现方式。研究团队设计并实现了一个自动化测试框架，通过向多个主流中文LLM服务（如百度文心一言、阿里巴巴通义千问等）发送精心构造的提示词，评估它们对敏感话题（如政治、历史、社会事件等）的响应一致性。实验发现，不同服务在审查的严格程度、触发审查的关键词模式、以及拒绝回答的措辞上存在显著差异。部分服务会直接拒绝回答，另一些则提供符合官方立场的回答，还有服务会给出模糊或转移话题的回复。论文进一步分析了审查政策的文本依据，并讨论了这种不一致性对用户信息获取和言论自由的影响。研究贡献在于首次大规模、多维度地刻画了中国LLM服务的审查实现现状，为理解AI时代的信息控制提供了实证数据。

💡 推荐理由: 揭示了中文LLM服务审查政策的实现差异，对理解AI内容监管、用户信息获取质量及跨国服务合规具有参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

Cyber Security Daily Radar

#ai-governance

The AI Resilience Gap: Bringing Artificial Intelligence Inside the Operational Resilience Perimeter

Overview of Risk Assessment and Management for Intelligent Systems under the AI Act and Beyond

RAI2: Responsible Identity Audit Governing the Artificial Intelligence.

Characterizing the Implementation of Censorship Policies in Chinese LLM Services.