#cis-controls 主题 - Cyber Security Daily Radar

👥 作者: Gustavo Roberto Pinto, Arthur do Prado Labaki, Rodrigo Sanches Miani

本文研究大型语言模型（LLMs）在网络安全风险评估中的可靠性，采用CIS控制为基础的方法。研究背景是：组织面临网络安全人员短缺和威胁不断演变的挑战，LLMs被视为潜在辅助工具，但其可能生成不可靠或幻觉内容导致错误决策。核心问题是：LLMs在风险评估中是否可靠，能否替代人类专家？方法上，作者设计了包含多个风险场景的问卷，收集了50名人类专家的响应，并与五个主流LLM（如GPT-4等）的答案进行对比。通过统计分析，发现LLMs与人类专家在风险评分上存在显著差异，且LLMs总体倾向于低估风险。实验结果表明，LLMs无法完全替代人类进行风险评估，必须保留人类监督环节。主要贡献是：定量揭示了LLM在风险感知上的系统性偏差，并强调了人机协同的必要性——LLM应作为辅助工具而非独立评估者。该研究适合安全分析师、风险管理者和AI应用开发者阅读，用以指导LLM在安全评估中的谨慎使用。

💡 推荐理由: 安全从业者需警惕LLM在风险评估中“过度自信”的反面——低估风险，避免因自动化导致误判。

🎯 建议动作: 纳入内部评估：在安全风险评估中引入人类专家复核LLM输出，建立混合评估流程。

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

#cis-controls

Evaluating the Reliability of Multiple Large Language Models in Risk Assessment: A CIS Controls Based Approach