#log-analysis 主题 - Cyber Security Daily Radar

👥 作者: Shoya Otsu, Kei Suzuki, Toshiaki Koike-Akino, Jing Liu, Ye Wang

本论文提出了一种名为 CAPTAIN（Context-Augmented Perplexity-based Threat Activity log detectIoN）的 APT 检测方法。研究背景是高级持续性威胁（APT）检测的难点在于大规模日志中仅有极小部分事件是恶意的，传统方法依赖大量人工标注和复杂的预处理管道，工程成本高。CAPTAIN 利用预训练的语言模型，通过最小化领域无关的预处理，基于困惑度（perplexity）对日志条目进行评分。该方法的核心创新在于引入上下文增强机制：使用编码器模型和 Q-Former 风格的桥接结构对近期历史日志进行编码，生成紧凑的上下文令牌，注入到解码器输入中，使困惑度评分能够反映时间上下文信息。此外，CAPTAIN 还通过平滑滤波器对困惑度时间序列进行稳定化处理。在多个 APT 基准测试上，CAPTAIN 与强基线方法性能相当，且对非精细化预处理输入具有鲁棒性，从而显著降低了日志预处理的发展与运维成本。该工作表明，无需复杂的数据清洗即可实现有效的 APT 检测，为安全运营团队提供了一种轻量级、可扩展的解决方案。

💡 推荐理由: 降低 APT 检测对大量人工标注和复杂预处理管道的依赖，使语言模型能够直接用于原始日志，显著减少工程成本，对资源有限的蓝队团队极具吸引力。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Rabimba Karanjai, Yang Lu, Hemanth Hegadehalli Madhavarao, Lei Xu, Weidong Shi

该论文研究了大型语言模型（LLM）在安全运营中心（SOC）日志分析任务中的安全漏洞。作者指出，LLM 在分析网络日志时，会将日志内容作为自然语言上下文处理，这引入了一种关键威胁：攻击者可以在日志生成字段中嵌入提示注入载荷，这些载荷持久化存储在日志中，当分析师查询 LLM 时被执行，作者称之为被动提示注入。为系统评估这类威胁，作者提出了 LogInject 框架，并构建了包含 12,847 条日志条目（含 2,569 条对抗样本）的基准数据集 LogInject-1.0。在四种攻击目标（活动隐藏、误报生成、信息窃取、输出劫持）下，评估了三款商用 LLM，基线条件下攻击成功率最高达 88.2%（平均 83.4%）。此外，作者提出了一种新技术 Context Stitching，将载荷碎片化分布在多条日志条目中以绕过无状态过滤器，同时利用 LLM 的长上下文推理能力，成功率达 76.4%。防御方面，作者评估了结合输入过滤、提示加固和输出验证的分层防御，攻击降低率达 90.4%，但仍存在 8.4% 的残留脆弱性。实验表明，基于 LLM 的日志分析存在固有的混淆代理漏洞，不可信数据与可信指令难以区分，需要深度防御架构和持续人工监督。该研究适合 SOC 安全工程师、AI 安全研究人员阅读。

💡 推荐理由: 揭示了 LLM 在 SOC 日志分析中面临的上下文污染威胁，为防御者提供了攻击向量和缓解措施的量化评估，对部署 LLM 进行安全运维的团队具有重要警示作用。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)

👥 作者: Abdulellah Alsaheel, Yuhong Nan, Shiqing Ma, Le Yu, Gregory Walkup, Z. Berkay Celik, Xiangyu Zhang 0001, Dongyan Xu

攻击调查是安全运营中识别攻击步骤和根因的关键环节。传统方法依赖专家规则或图分析，难以应对复杂多步攻击。本文提出ATLAS，一种基于序列学习的攻击调查方法。核心思想是将系统日志转化为事件序列，利用深度学习模型（如LSTM）学习攻击模式，自动识别攻击路径。该方法首先对日志进行预处理，提取事件序列特征，然后使用序列分类模型区分正常与恶意行为。实验在真实数据集上验证，相比基线方法，ATLAS在精确率和召回率上均有显著提升，能够有效发现隐蔽攻击。主要贡献包括：1）提出序列化日志建模方式；2）设计轻量级深度学习模型；3）在多种攻击场景下验证有效性。适合安全分析师和研究人员阅读。

💡 推荐理由: 攻击调查自动化是SOC效率瓶颈，ATLAS提供了一种不依赖人工规则的序列学习方法，有望提升攻击溯源能力。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.6)

👥 作者: Hailun Ding, Juan Zhai, Yuhong Nan, Shiqing Ma

本文提出 AIRTAG，一个基于无监督学习的自动化攻击调查框架，旨在从原始日志文本中自动识别攻击事件、生成语义标签并定位根因，无需依赖预定义的攻击知识库或规则。现有攻击调查方法通常需要人工定义攻击模式或依赖规则匹配，难以应对新型或变种攻击。AIRTAG 利用预训练语言模型（如 BERT）将日志消息编码为上下文感知的语义向量，通过无监督聚类算法（如 HDBSCAN）将日志分组为不同的事件簇，每个簇代表一个攻击步骤或原子行为。然后利用时间序列分析和图论方法构建事件之间的时序因果关系，最终生成攻击调查图并推断根因。实验在多个公开数据集（如 DARPA TC、OpenStack 日志）上评估，结果表明 AIRTAG 能够有效识别多步攻击链，在真实攻击场景下达到高准确率（F1 分数超过 0.9），并且比现有监督方法具有更好的可迁移性。该工作的主要贡献在于：1) 提出了完全无监督的日志语义理解框架；2) 结合预训练语言模型与聚类、时序推理，实现了对未知攻击的自动调查；3) 公开了原型系统和实验数据，为后续研究提供基准。

💡 推荐理由: 自动化攻击调查是 SOC 痛点，该工作无需知识库即可从日志中还原攻击链，有望降低分析师手动关联日志的人力成本，并提升对新型攻击的响应速度。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Chaitanya Vilas Garware, Sharif Noor Zisad

该论文提出了 OpenSOC-AI，一个轻量级的日志分析框架，旨在帮助中小型企业（SMBs）在没有完整安全运营中心（SOC）或企业级检测平台的情况下，利用大语言模型进行自动化威胁分析。框架基于参数量为 11 亿的 TinyLlama 模型，采用低秩适配（LoRA）技术进行参数高效微调，仅更新 1260 万个参数（约占基础模型参数的 1.13%）。在 450 条特定于 SOC 场景的日志样本上，使用单张 NVIDIA T4 GPU 在不到 5 分钟内完成微调。实验使用 50 条留出样本进行测试，结果显示：威胁分类准确率从微调前的 0% 提升至 68%，严重性评估准确率从 28% 提升至 58%，F1 分数达到 0.68，显著优于未微调的基线模型。此外，模型还能执行 MITRE ATT&CK 技术映射。作者公开了完整代码、适配器权重和数据集，以促进可复现性和社区扩展。这项工作的主要贡献在于证明了极小的训练成本和计算资源即可为 SMBs 提供可行的日志分析辅助工具，降低安全运营门槛。

💡 推荐理由: 该研究为资源有限的企业提供了一种低成本、易于部署的日志分析方案，有望提升 SMBs 的威胁检测能力，同时推动 LLM 在安全运营中的实际应用。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

Cyber Security Daily Radar

#log-analysis

Beyond Heavy Log Curation: Perplexity-Based APT Detection via Unsupervised, Context-Augmented Language Models

Context Contamination in LLM Analysis of Network Security Logs: Poison with Passive Prompt Injection and Mitigation Evaluation

ATLAS: A Sequence-based Learning Approach for Attack Investigation.

AIRTAG: Towards Automated Attack Investigation by Unsupervised Learning with Log Texts.

OpenSOC-AI: Democratizing Security Operations with Parameter Efficient LLM Log Analysis