#reinforcement-learning

共收录 7 条相关安全情报。

← 返回所有主题
👥 作者: Ayan Javeed Shaikh, Nathaniel D. Bastian, Ankit Shah

该论文提出了一种面向AI驱动的安全编排、自动化和响应(SOAR)系统的自主红队框架,旨在评估此类系统对自适应对手的韧性。现有研究鲜少探索SOAR系统在面对复杂、多阶段攻击时的表现。作者将大型语言模型(LLM)与强化学习(RL)相结合,构建了一个分层架构:高层LLM规划器负责制定战略意图(如攻击目标与阶段),底层RL控制器则根据规划进行战术执行(如具体操作选择)。通过基于杀伤链进程的奖励塑形机制,该框架能够生成自适应、多阶段的攻击行动,以测试企业网络中的自主防御代理。作者在保真度较高的企业网络仿真环境中进行了评估,结果表明该混合方法能够有效生成复杂攻击,而纯LLM架构则难以维持多阶段攻击,且专门面向网络安全的领域模型仅能达到有限的攻击效果。研究证实,单纯依赖LLM或领域模型均不足以进行有效的红队评估,混合LLM-RL方法更具优势。该工作为AI驱动的安全系统评估提供了新思路,适合红队研究人员、SOAR系统开发者及安全评估工程师关注。

💡 推荐理由: 该研究首次结合LLM与强化学习进行自适应红队测试,揭示了当前AI驱动SOAR系统在面对多阶段、自适应攻击时的薄弱环节,为防御者改进系统韧性提供了关键方向。

🎯 建议动作: 研究跟进,评估该框架是否可适配到自身SOAR系统的红队测试中

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Syed Waqas Ali, Ibrar Ali Shah, Farzana Zahid, Daniyal Munir, Hans D. Schotten

该论文针对云计算环境中入侵检测系统(IDS)面临的挑战——分层动态架构、未知攻击/零日攻击,以及机器学习模型在实验环境表现良好但在实际云部署中性能下降的问题,提出了一种基于强化学习的多层级、置信度感知的入侵检测框架。系统覆盖网络层、主机层和虚拟机监控器层三层。每层使用机器学习模型检测已知攻击,同时生成预测置信度。在多层流程中,低置信度事件先后经过两个门控:学习阈值置信门(Gate-1)和Chroma记忆匹配门(Gate-2),未解决的事件被转发到大语言模型(LLM)进行语义分析和解释。最终的攻击判定在Gate-3使用校准后的LLM置信度或加权融合回退,不确定事件被保留在评审桶中避免强制分类。生成的解释和确认的知识存储在ChromaDB中支持未来分析和重训练。实验首先使用静态阈值建立基线,结果显示所提系统学会了自适应阈值,并将LLM升级率降低了58.78%,同时保持了强性能(准确率88.68%,精确率85.29%,召回率84.72%,F1分数85.00%)。网络层和虚拟机监控器层分别达到98.02%和97.08%的准确率,展示了平衡且高效的检测系统。

💡 推荐理由: 该工作将强化学习与大语言模型结合,解决了云环境中IDS的实际部署问题,显著降低LLM调用成本同时保持高性能,为云安全运维提供了可落地的智能检测方案。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
推荐 11.5
Conf: 50%
👥 作者: Amrita Roy Chowdhury 0001, David Glukhov, Divyam Anshumaan, Prasad Chalasani, Nicolas Papernot, Somesh Jha, Mihir Bellare

本文提出名为 Prεεmpt 的框架,旨在解决大语言模型(LLM)输入提示中包含的敏感信息泄露风险。现有方法要么依赖手动规则,要么无法在隐私保护与模型效用之间取得良好平衡。Prεεmpt 采用基于强化学习的智能清洗机制,能够自动识别提示中的敏感实体(如姓名、地址、身份证号等),并将其泛化为语义等价但不可直接识别的替代符,同时保留任务所需的上下文信息。具体地,框架包含一个可训练的清洗策略网络,通过奖励函数同时优化隐私保护程度和下游任务性能。在多个基准数据集(如命名实体识别、情感分析、问答)上的实验表明,Prεεmpt 相比基线方法(如随机替换、差分隐私提示)在隐私-效用权衡上取得显著提升:在保持高任务准确率(平均下降<2%)的前提下,将敏感信息泄露风险降低超过80%。此外,Prεεmpt 具备模型无关性,可灵活适配不同 LLM 架构和任务类型。该工作为构建隐私安全的 LLM 应用提供了自动化、可扩展的解决方案。

💡 推荐理由: LLM 应用中的提示隐私是实际部署的关键挑战,Prεεmpt 首次将强化学习用于敏感提示清洗,兼顾效用与隐私,对安全合规场景(如医疗、金融)有直接参考价值。

🎯 建议动作: 研究跟进,评估若引入内部 LLM 工作流中的提示清洗环节。

排序因子: 来自网络安全顶级会议 (+8) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
INFO
PAPER 2026-05-14

Reinforcement Unlearning.

推荐 14.5
Conf: 50%
👥 作者: Dayong Ye, Tianqing Zhu, Congcong Zhu, Derui Wang, Kun Gao 0006, Zewei Shi, Sheng Shen 0005, Wanlei Zhou 0001, Minhui Xue 0001

本文首次系统性地研究了强化学习中的机器遗忘问题,即“强化遗忘”。传统机器遗忘研究主要关注监督学习和无监督学习,而强化学习领域中,智能体在与环境交互过程中会记忆环境特征,引发隐私风险。根据数据保护法规,环境所有者有权撤销智能体对训练数据的访问,因此需要让智能体遗忘特定环境的知识。然而,强化遗忘面临三个独特挑战:1) 如何设计针对环境的遗忘方案;2) 如何避免遗忘过程损害智能体在其他环境中的性能;3) 如何有效评估遗忘效果。针对这些挑战,作者提出了两种强化遗忘方法:第一种基于递减强化学习,通过逐步减少目标环境中的奖励信号,使智能体逐渐擦除先前学到的知识;第二种利用环境中毒攻击,在目标环境中注入误导性反馈,迫使智能体学习错误知识以覆盖原有记忆。此外,为了评估遗忘效果,作者引入了“环境推断”概念,即通过分析智能体在目标环境中的行为来判断遗忘是否成功。实验部分(依据摘要推断)在多个连续控制环境中验证了两种方法的有效性,表明它们能在保持其余环境性能的同时实现遗忘,且环境推断能够可靠地量化遗忘程度。该研究填补了强化学习遗忘领域的空白,为隐私合规提供了新的技术路径。

💡 推荐理由: 强化学习广泛应用于机器人、自动驾驶、游戏等场景,环境数据可能包含敏感信息。本文提出的强化遗忘方法首次解决了环境级数据删除的隐私需求,对满足GDPR等法规的“被遗忘权”至关重要,同时启发了安全从业者关注强化学习模型的数据生命周期管理。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Philip Huff, Dakota Dale, Harshith Guduru, Rohan Singh, Qinghua Li

本文提出一个将网络安全治理框架(如NIST CSF)转化为可操作的缓解决策的系统。核心挑战在于治理框架虽能评估组织成熟度,但无法直接指导在资源约束下对防御策略进行选择和优先级排序。该方法首先将CSF成熟度评估映射到MITRE ATT&CK缓解能力,使组织安全态势与以攻击者为中心的防御规划直接集成。为了处理对手行为的复杂性,采用可变阶马尔可夫模型(VOMM)在观察到的ATT&CK技术序列上训练,以在深度强化学习(DRL)环境中实现可扩展的对手模拟。通过集束搜索重构可能的攻击路径和防御响应,然后在明确预算约束下联合优化缓解措施的选择。该环境支持并发对手和现实缓解成本。实验在多种奖励设定和配置下表明,该方法能产生稳定的策略、有意义的成本-风险权衡以及与组织成熟度一致的可解释缓解计划。研究证明了攻击者感知的DRL能够生成基于实际框架和威胁行为的、资源受限的实用防御策略。

💡 推荐理由: 该研究弥补了治理框架(如NIST CSF)与具体安全运营决策之间的鸿沟,提供了一种基于攻击路径建模和强化学习的自动化缓解规划方法,使组织能在预算约束下优先采取与自身成熟度匹配的防御措施,具有实际应用价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Wesley Duclos, Yujing Zhou, Jian Wang, Yongxin Liu, Huihui Wang

该研究针对自主交叉口管理(AIM)系统的网络攻击防御问题,提出了一种基于强化学习(RL)的框架。AIM 系统通过车辆与基础设施(V2I)通信优化交通流,但其网络依赖性使其面临拒绝服务(DoS)、数据操纵和恶意软件等威胁。研究者利用近端策略优化(PPO)和优势行动者-评论家(A2C)两种强化学习算法,在数字孪生仿真环境中训练智能体,使其能够实时检测并缓解上述攻击。实验结果表明,所提框架能有效提升 AIM 系统的自适应安全韧性,在保障交通效率的同时抵御恶意行为。该工作为智能交通系统(ITS)的主动防御提供了新思路,证明了强化学习在动态、高安全保障场景中的潜力。

💡 推荐理由: 智能交通系统的安全性直接关乎公共安全,而 AIM 作为核心组件易受攻击。本研究探索了强化学习在实时防御中的可行性,为蓝队防御自动驾驶基础设施提供了创新方法。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.4)
👥 作者: Chen Gong 0005, Zheng Liu, Kecen Li, Tianhao Wang 0001

该论文提出了PrivORL,这是首个将差分隐私(DP)应用于离线强化学习(RL)数据集合成的方法。离线RL通过共享预收集的轨迹或过渡数据来训练智能体,避免与环境的直接交互,在导航等关键任务中有效。然而,数据集可能包含敏感信息,存在隐私泄露风险。PrivORL利用扩散模型(用于过渡合成)和扩散Transformer(用于轨迹合成)在差分隐私保护下生成合成数据集。该方法采用先在公开数据集上预训练生成器,再在敏感数据集上使用DP-SGD微调的策略。此外,PrivORL引入好奇心驱动的预训练,通过好奇心模块的反馈增加合成数据的多样性,从而生成与敏感数据集高度相似且多样化的合成过渡和轨迹。在五个敏感离线RL数据集上的大量实验表明,与基线方法相比,PrivORL在DP过渡和轨迹合成中均实现了更优异的效用和保真度。论文提供了GitHub仓库的复现包。

💡 推荐理由: 离线强化学习在医疗、金融等敏感场景中的应用日益广泛,数据集隐私泄露可能造成严重后果。PrivORL提供了首个实用的差分隐私数据合成方案,有助于在保护隐私的同时推动离线RL研究的发展。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)