#automation

共收录 5 条相关安全情报。

← 返回所有主题
👥 作者: Andrew Hamara, Dwight Horne, Aldehir Rojas, Timothy Kurniawan, Sophie Lamothe, Vishal Suresh, Nicholas Turoci, Lawrence Wong

本文提出 SHIELDS,一个基于多智能体系统和大语言模型(LLM)的自动化操作系统加固框架。针对安全配置错误是操作系统级漏洞的主要成因,而手动维护系统合规性(如符合 DISA STIGs 标准)既繁琐又昂贵的问题,现有自动化工具依赖静态预定义的修复措施,灵活性不足。SHIELDS 将 OS 加固视为迭代的反馈驱动过程:系统利用多个 LLM 智能体,持续提出修复方案,并根据目标系统执行结果和合规性扫描反馈进行优化。作者在多种虚拟机配置上评估了 6 个参数规模从 20B 到 400B 的当代 LLM,实验表明 SHIELDS 最高可修复 73% 的扫描发现项。研究还发现,在此场景下,模型规模(参数数量)对成功的影响小于有效的工具使用和信息收集能力,这为在计算资源受限或安全性/隐私需求驱动本地模型使用的环境中减少安全合规负担提供了可行路径。本文的主要贡献在于:1) 设计并实现了首个将多智能体协作与 LLM 结合用于 OS 加固迭代修复的系统;2) 通过实验证明其有效性,并揭示模型规模并非决定性因素;3) 为利用 LLM 进行自动化合规修复提供了新范式。适合安全运维人员、合规工程师及自动化工具开发者阅读。

💡 推荐理由: 该研究展示了利用 LLM 和多智能体协作自动化 OS 加固的可行性,最高 73% 的修复率可显著降低手动合规成本,且不依赖大模型,适合资源受限环境。为安全自动化和合规管理提供了新的思路,值得关注。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Farooq Shaikh

该论文提出一个名为FORGE的多智能体系统,旨在打通漏洞披露、利用优先级排序和检测规则工程三个通常孤立的研究领域。当前自动化利用生成系统仅报告二元通过/失败结果,丢弃部分进展,且不产生对其他两个领域有用的信号。FORGE通过“渐进式利用深度”作为桥梁机制,由五个专用智能体(Intel、Generator、Planner、Exploit、Detector)组成固定流水线:(1) 从CVE元数据生成针对性漏洞应用;(2) 通过LLM主评估器在四级分类(L0无证据到L3完全利用)下进行引导式多轮利用尝试;(3) 基于OpenTelemetry利用轨迹生成Sigma和Snort检测规则。深层利用产生更丰富的行为轨迹,有助于检测规则工程;而跨评分带的深度数据为优先级排序验证提供真实依据。分层知识架构跨评估累积情报,将构建和利用经验迁移到后续CVE。在CVE-GENIE数据集的603个CVE上评估,实现了67.8%的端到端L1+利用成功率,每个CVE成本1.50美元,覆盖8种语言和187种CWE类型。无论EPSS或CVSS评分高低,利用率均接近68%,表明模式级可达性与基于元数据的优先级排序正交。L2+利用导出的检测规则相比L1规则具有显著更高的跨度归一化基础性(p=0.035),93.4%的Snort规则在合成良性语料上产生零误报。

💡 推荐理由: 该研究首次将自动化利用生成、优先级排序和检测规则工程集成到一个多智能体系统中,解决了长期存在的社区隔离问题,显著提升了检测规则的生成质量和利用成功率,为安全团队提供了高效的自动化评估和检测能力。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
推荐 9.6
Conf: 50%
👥 作者: Qi-An Fu, Yinpeng Dong, Hang Su 0006, Jun Zhu 0001, Chao Zhang 0008

本文提出 AutoDA(Automated Decision-based Iterative Adversarial Attacks),一种自动化决策型迭代对抗攻击方法。传统决策型攻击需要人工设计查询策略和超参数,效率低且泛化性差。AutoDA 通过自动搜索最优的迭代攻击方案,包括步长、扰动方向更新策略等,从而在有限的查询次数内高效生成对抗样本。该方法在黑盒场景下(仅能获得模型最终决策)实现高攻击成功率,同时在ImageNet等大规模数据集上验证了其有效性。实验表明,AutoDA 在攻击成功率和查询效率上均优于现有决策型攻击方法,并揭示了当前深度神经网络在决策级鲁棒性上的脆弱性。

💡 推荐理由: 该研究自动化了决策型对抗攻击的调参过程,降低了攻击门槛,可能被攻击者利用来更高效地评估模型鲁棒性或发起黑盒攻击。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.6)
👥 作者: Ian Dardik, Yining She, Sam Procter, Keaton Hanna, Lutz Wrage, Eunsuk Kang

该论文提出了一种名为FASR(Formalizing and Automating STPA with Robustness)的自动化工具,旨在支持系统理论过程分析(STPA)中的不安全控制动作(UCA)识别。STPA是一种广泛应用于安全关键系统的危险分析技术,但其大部分步骤依赖人工执行,耗时且易错。FASR利用基于模型的工程和形式化方法,结合鲁棒性分析的最新进展,通过识别控制器行为中的不良偏差来自动、完整地发现UCA。论文在航空电子系统中的制动系统控制单元(BSCU)案例上演示了工具的使用,并开展了一项包含9名参与者的用户研究,参与者具有STPA、基于模型的工程和形式化方法的不同背景。研究结果表明,大多数参与者认为FASR是识别UCA的有用辅助工具,同时提出了改进建议,以使类似工具适用于更广泛的系统和分析师。该研究初步展示了自动化STPA的潜力与局限,为安全关键系统的危险分析提供了新的自动化路径。

💡 推荐理由: 安全关键系统的危险分析长期依赖人工,效率低且易遗漏;FASR提出的自动化方法有望减少人为错误,提升分析完整性与可复现性。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Harish Balaji, Aarav Varshney, Prasanna Ravi, Sripal Jain, Robin Foe, Jorden Seet, Huaxiong Wang, Kwok-Yan Lam, Anupam Chattopadhyay

本文针对金融行业在后量子密码(PQC)迁移过程中面临的操作性瓶颈,提出了一种自动化的TLS配置解析与混合PQC部署方法。背景是:大规模量子计算机尚未出现,但组织需要提前升级密码基础设施以抵御未来的量子攻击。NIST已标准化PQC密钥交换与数字签名算法,如ML-KEM(原Kyber),但实际部署中,企业面临异构环境(如Web服务器、API网关、负载均衡器、反向代理)中TLS配置不透明、缺乏统一视图、手动配置易错等挑战。作者认为瓶颈在于操作层面而非算法层面——主流库已支持混合密钥交换(如ML-KEM与经典算法结合),但安全团队没有精确的可视化和可重复的方法来启用兼容设置。 核心贡献包括:1)提出一种配置解析方法,自动从主流企业Web服务器(如Nginx、Apache等)提取并规范化TLS密码学配置,生成带有来源追溯的统一密码学清单(Cryptographic Inventory),作为迁移和合规的基础。2)在8443个来自公共仓库的真实Nginx配置上验证了该方法的可行性,并在某金融机构的概念验证部署中,对内部应用的TLS终端(Web服务器和API网关)启用了ML-KEM及混合ML-KEM密钥交换,零应用层代码修改,性能开销可控。 实验表明,该方法能有效识别当前TLS配置中的量子脆弱组件,辅助制定迁移优先级,并确保合规性。论文主要面向金融行业的安全架构师、密码学工程师和运维团队,为他们提供一套可操作的工具链,以加速PQC的规模化落地。

💡 推荐理由: 后量子密码迁移是未来5-10年密码学领域最重要的工程挑战。本文提供了解决异构TLS配置可视化和自动化部署的实用方法,对金融等强监管行业有直接参考价值。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)