#process-mining

共收录 2 条相关安全情报。

← 返回所有主题
👥 作者: Zvi Topol

这篇论文提出了一种新的方法来评估大型语言模型(LLM)在面对红队攻击时的鲁棒性。传统的评估方法通常只使用攻击成功率(ASR)这一单一指标,将多次攻击简化为一个二元结果,忽略了模型在攻击过程中如何逐步抵抗或屈服的结构化行为。作者创新性地将过程挖掘(process mining)技术应用于红队攻击追踪数据,从事件日志中提取并分析过程模型。实验设计包含60个来自HarmBench的提示词,针对两个LLM(GPT-OSS 120B和Llama 3.3 70B),使用10种提示词变异策略,每个提示最多尝试110次,共生成8,575个带分数的事件。通过提取直接跟随图(DFGs)和状态转移矩阵,论文揭示了传统ASR无法捕捉的结构性防御差异:GPT-OSS表现出近似吸收的拒绝状态(一旦拒绝几乎不再被攻破),而Llama则显示出多个从拒绝状态成功越狱的渗透路径。此外,实验还发现变异器的有效性在模型间呈现不对称性,且不同模型的时间-越狱分布相差一个数量级。这项研究提供了更深入理解LLM安全行为的方法,适合AI安全研究人员、红队评估人员以及LLM安全开发人员阅读。

💡 推荐理由: 传统的攻击成功率指标失于粗糙,过程挖掘方法能揭示模型防御行为的深层结构,帮助安全团队发现不同模型在对抗攻击中的薄弱环节,从而设计更针对性的防御策略。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Luis-Armando Rodríguez-Flores, Luciano García-Bañuelos, Abel Armas-Cervantes, Astrid-Monserrat Rivera-Partida

合规性检查是过程挖掘的核心操作之一,旨在识别过程模型与事件日志之间的差异。过程模型代表预期的行为,而事件日志则记录了信息系统中的实际过程行为。传统上,执行合规性检查的业务分析师可以同时访问过程模型和事件日志。然而,在某些场景下,日志所有者可能希望保护日志中的关键或敏感信息,同时仍能检查其与另一方过程模型的合规性。本文提出了一种基于令牌回放算法和同态加密的安全合规性检查方法。该方法利用同态加密的性质,在加密日志数据上进行合规性计算,从而在不泄露原始日志内容的前提下得到合规性结果。作者使用合成日志进行了评估,结果表明该技术具有实用性。本研究主要面向过程挖掘、隐私保护及安全审计领域的研究人员与实践者。

💡 推荐理由: 该研究解决了过程挖掘中敏感日志的隐私保护问题,使组织能在不泄露内部数据的情况下与第三方进行合规性检查,对于涉及数据共享的安全审计和监管合规场景有重要参考价值。

🎯 建议动作: 研究跟进

排序因子: Community 数据源 (+1) | LLM 评分加成 (+0.5)