#automation 主题 - Cyber Security Daily Radar

👥 作者: Rishabh Khandelwal, Asmit Nayak, Hamza Harkous, Kassem Fawaz

本文针对在线网站广泛使用的Cookie通知（cookie notice）进行研究。近年来，GDPR和CCPA等隐私法规要求网站在收集用户数据前获取用户同意，但许多网站采用暗黑模式（dark patterns）诱导用户做出有利于网站而非保护隐私的选择。作者提出了一个名为CookieEnforcer的自动化系统，旨在自动发现Cookie通知并执行操作以禁用所有非必要的Cookie。系统包含两个核心模块：首先是一个基于HTML元素渲染模式的自动Cookie通知检测器，能够从网页中准确定位Cookie通知弹窗；其次，通过将问题建模为序列到序列（seq2seq）任务，分析Cookie通知并预测需要点击的选项序列，从而禁用所有非必要Cookie。实验表明，CookieEnforcer在端到端准确率评估中能在91%的情况下生成正确的操作步骤。通过用户研究，该工具显著减少了用户手动配置Cookie的负担。最后，作者利用该系统对Tranco列表中前5000个网站（分别从美国和英国访问）进行了大规模测量，比较并记录了不同地区的Cookie通知实践差异。该研究为自动化隐私合规提供了有效的技术方案，适用于安全研究员、隐私工程师以及关注用户隐私保护的开发者。

💡 推荐理由: Cookie通知中的暗黑模式严重威胁用户隐私，CookieEnforcer自动化工具可帮助用户和研究者大规模检测并规避此类操纵行为，提升隐私保护水平。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: John Bianchi, Luca Petrillo, Fabio Martinelli, Marinella Petrocchi

本文针对云安全中安全控制项到技术指标的手动映射效率低下的问题，提出了一种基于领域自适应Sentence Transformer模型的自动化方法。研究首先从五个欧洲安全标准（如ISO 27001、CSA CCM等）和技术指标集合中构建了一个包含3,499个语义对的训练语料库，并通过回译和基于大语言模型的释义技术将语料扩展至四个场景下的13,996个样本。作者微调了五种Sentence Transformer架构（如multi-qa-mpnet-dot-v1等），并在两个独立任务上评估性能：控制项到指标映射和跨标准控制项关联。实验结果表明，所有微调模型均显著优于零样本基线。在控制项到指标任务上，最佳模型在nDCG@10指标上提升高达23个百分点；在跨标准控制关联任务上，使用回译数据的multi-qa-mpnet-dot-v1模型达到0.870 nDCG@10。研究证实，领域内训练数据是提升此类任务性能的主要驱动力。该工作为云安全合规自动化提供了可行的技术路径。

💡 推荐理由: 云安全合规手动映射工作繁重且易错，该方法可显著提升效率与准确性，帮助安全团队自动化满足多项标准要求。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Shirley Zhang 0002, Paul Chung, Jacob Vervelde, Nishant Korapati, Rahul Chatterjee 0001, Kassem Fawaz

该论文研究了智能家居自动化应用（如智能锁、摄像头、恒温器等）在亲密伴侣暴力（IPV）中被滥用的现象。作者通过分析真实案例、用户报告以及应用功能，揭示了施虐者如何利用这些设备进行监视、控制、骚扰和威胁受害者，例如远程锁定门锁、调节温度至极端、通过摄像头监控伴侣行踪等。论文提出了一种可滥用性评估框架，用于系统性地识别自动化应用中的设计缺陷和功能滥用风险，并探讨了技术缓解措施，如权限细化、使用模式异常检测、以及用户教育。实验部分包括对主流智能家居平台（如IFTTT、SmartThings）的功能测试，发现许多常见自动化场景存在被恶意利用的潜在路径。适合智能家居安全研究人员、反家庭暴力组织、产品设计师和安全策略制定者阅读。

💡 推荐理由: 揭示了智能家居自动化设备被用作新型暴力工具的风险，为家庭暴力受害者保护、物联网安全设计及政策制定提供警示和指导。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Lea Roxanne Muth, Marian Margraf

本文提出了一种新颖的方法，利用多大型语言模型系统（MLS）与混合检索增强生成（HybridRAG）技术，实现BSI IT-Grundschutz认证的半自动化。研究背景是欧盟NIS2指令的出台导致更多企业需要获得信息安全认证，但专业认证人员短缺、实施成本高昂。该MLS架构集成了多个LLM和知识图谱（KG），以支持认证流程的不同阶段：保护需求评估、建模、IT-Grundschutz检查、措施整合以及后续实现。具体而言，系统通过HybridRAG结合了结构化知识图谱中的领域知识和非结构化文本中的信息，从而更准确地理解认证要求并生成安全概念。实验部分（在论文中应包含，但摘要未提及）可能展示了该系统在提高效率、降低成本方面的效果。该研究旨在解决NIS2带来的数字安全挑战，通过自动化辅助减轻认证人员的工作负担，同时保持安全概念的质量。主要贡献包括：1）提出了一种专门针对IT-Grundschutz认证的MLS架构；2）设计了HybridRAG方法融合知识图谱和LLM；3）探讨了在实际认证场景中应用LLM的可行性和潜在优势。适合安全合规人员、认证机构以及正在准备NIS2合规的企业阅读。

💡 推荐理由: 该研究直接回应了NIS2指令下企业认证需求激增与专业资源短缺的矛盾，提出了自动化辅助方案，有望降低合规成本并提升效率。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Andrew Hamara, Dwight Horne, Aldehir Rojas, Timothy Kurniawan, Sophie Lamothe, Vishal Suresh, Nicholas Turoci, Lawrence Wong

本文提出 SHIELDS，一个基于多智能体系统和大语言模型（LLM）的自动化操作系统加固框架。针对安全配置错误是操作系统级漏洞的主要成因，而手动维护系统合规性（如符合 DISA STIGs 标准）既繁琐又昂贵的问题，现有自动化工具依赖静态预定义的修复措施，灵活性不足。SHIELDS 将 OS 加固视为迭代的反馈驱动过程：系统利用多个 LLM 智能体，持续提出修复方案，并根据目标系统执行结果和合规性扫描反馈进行优化。作者在多种虚拟机配置上评估了 6 个参数规模从 20B 到 400B 的当代 LLM，实验表明 SHIELDS 最高可修复 73% 的扫描发现项。研究还发现，在此场景下，模型规模（参数数量）对成功的影响小于有效的工具使用和信息收集能力，这为在计算资源受限或安全性/隐私需求驱动本地模型使用的环境中减少安全合规负担提供了可行路径。本文的主要贡献在于：1) 设计并实现了首个将多智能体协作与 LLM 结合用于 OS 加固迭代修复的系统；2) 通过实验证明其有效性，并揭示模型规模并非决定性因素；3) 为利用 LLM 进行自动化合规修复提供了新范式。适合安全运维人员、合规工程师及自动化工具开发者阅读。

💡 推荐理由: 该研究展示了利用 LLM 和多智能体协作自动化 OS 加固的可行性，最高 73% 的修复率可显著降低手动合规成本，且不依赖大模型，适合资源受限环境。为安全自动化和合规管理提供了新的思路，值得关注。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Farooq Shaikh

该论文提出一个名为FORGE的多智能体系统，旨在打通漏洞披露、利用优先级排序和检测规则工程三个通常孤立的研究领域。当前自动化利用生成系统仅报告二元通过/失败结果，丢弃部分进展，且不产生对其他两个领域有用的信号。FORGE通过“渐进式利用深度”作为桥梁机制，由五个专用智能体（Intel、Generator、Planner、Exploit、Detector）组成固定流水线：(1) 从CVE元数据生成针对性漏洞应用；(2) 通过LLM主评估器在四级分类（L0无证据到L3完全利用）下进行引导式多轮利用尝试；(3) 基于OpenTelemetry利用轨迹生成Sigma和Snort检测规则。深层利用产生更丰富的行为轨迹，有助于检测规则工程；而跨评分带的深度数据为优先级排序验证提供真实依据。分层知识架构跨评估累积情报，将构建和利用经验迁移到后续CVE。在CVE-GENIE数据集的603个CVE上评估，实现了67.8%的端到端L1+利用成功率，每个CVE成本1.50美元，覆盖8种语言和187种CWE类型。无论EPSS或CVSS评分高低，利用率均接近68%，表明模式级可达性与基于元数据的优先级排序正交。L2+利用导出的检测规则相比L1规则具有显著更高的跨度归一化基础性（p=0.035），93.4%的Snort规则在合成良性语料上产生零误报。

💡 推荐理由: 该研究首次将自动化利用生成、优先级排序和检测规则工程集成到一个多智能体系统中，解决了长期存在的社区隔离问题，显著提升了检测规则的生成质量和利用成功率，为安全团队提供了高效的自动化评估和检测能力。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Ian Dardik, Yining She, Sam Procter, Keaton Hanna, Lutz Wrage, Eunsuk Kang

该论文提出了一种名为FASR（Formalizing and Automating STPA with Robustness）的自动化工具，旨在支持系统理论过程分析（STPA）中的不安全控制动作（UCA）识别。STPA是一种广泛应用于安全关键系统的危险分析技术，但其大部分步骤依赖人工执行，耗时且易错。FASR利用基于模型的工程和形式化方法，结合鲁棒性分析的最新进展，通过识别控制器行为中的不良偏差来自动、完整地发现UCA。论文在航空电子系统中的制动系统控制单元（BSCU）案例上演示了工具的使用，并开展了一项包含9名参与者的用户研究，参与者具有STPA、基于模型的工程和形式化方法的不同背景。研究结果表明，大多数参与者认为FASR是识别UCA的有用辅助工具，同时提出了改进建议，以使类似工具适用于更广泛的系统和分析师。该研究初步展示了自动化STPA的潜力与局限，为安全关键系统的危险分析提供了新的自动化路径。

💡 推荐理由: 安全关键系统的危险分析长期依赖人工，效率低且易遗漏；FASR提出的自动化方法有望减少人为错误，提升分析完整性与可复现性。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Harish Balaji, Aarav Varshney, Prasanna Ravi, Sripal Jain, Robin Foe, Jorden Seet, Huaxiong Wang, Kwok-Yan Lam, Anupam Chattopadhyay

本文针对金融行业在后量子密码（PQC）迁移过程中面临的操作性瓶颈，提出了一种自动化的TLS配置解析与混合PQC部署方法。背景是：大规模量子计算机尚未出现，但组织需要提前升级密码基础设施以抵御未来的量子攻击。NIST已标准化PQC密钥交换与数字签名算法，如ML-KEM（原Kyber），但实际部署中，企业面临异构环境（如Web服务器、API网关、负载均衡器、反向代理）中TLS配置不透明、缺乏统一视图、手动配置易错等挑战。作者认为瓶颈在于操作层面而非算法层面——主流库已支持混合密钥交换（如ML-KEM与经典算法结合），但安全团队没有精确的可视化和可重复的方法来启用兼容设置。核心贡献包括：1）提出一种配置解析方法，自动从主流企业Web服务器（如Nginx、Apache等）提取并规范化TLS密码学配置，生成带有来源追溯的统一密码学清单（Cryptographic Inventory），作为迁移和合规的基础。2）在8443个来自公共仓库的真实Nginx配置上验证了该方法的可行性，并在某金融机构的概念验证部署中，对内部应用的TLS终端（Web服务器和API网关）启用了ML-KEM及混合ML-KEM密钥交换，零应用层代码修改，性能开销可控。实验表明，该方法能有效识别当前TLS配置中的量子脆弱组件，辅助制定迁移优先级，并确保合规性。论文主要面向金融行业的安全架构师、密码学工程师和运维团队，为他们提供一套可操作的工具链，以加速PQC的规模化落地。

💡 推荐理由: 后量子密码迁移是未来5-10年密码学领域最重要的工程挑战。本文提供了解决异构TLS配置可视化和自动化部署的实用方法，对金融等强监管行业有直接参考价值。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

Cyber Security Daily Radar

#automation

Automated Cookie Notice Analysis and Enforcement.

Automated Compliance Mapping in Cloud Security with Domain-Adapted Sentence Transformers

Abusability of Automation Apps in Intimate Partner Violence.

An Approach for a Supporting Multi-LLM System for Automated Certification Based on the German IT-Grundschutz

SHIELDS: Automating OS Hardening with Iterative Multi-Agent Remediation

FORGE: Multi-Agent Graduated Exploitation and Detection Engineering

FASR: Automated Identification of Unsafe Control Actions in STPA

Operationalising Post Quantum TLS Automated Configuration Profiling and Hybrid PQC Deployment in Financial Infrastructure