该论文针对 Web 服务器日志的取证分析需求,提出了一种名为 CEF-Log 的上下文增强少样本思维链提示策略,用于大语言模型(LLM)。传统机器学习方法在日志检测中常被视为“黑箱”,难以提供符合法律要求的人类可读解释。CEF-Log 通过嵌入专家调查方法,设计了一个结构化的五步推理模板,引导模型学习如何分析日志,而非记忆特定模式。实验基于 CSIC 2010 数据集,仅使用四个示例便达到了 0.99 的 F1 分数,样本效率相比其他基于提示的方法提升了 10 倍。此外,论文还引入了新数据集 ForenWebLog,包含真实攻击和多步攻击序列,用于全面评估。定性分析表明,CEF-Log 生成的解释可追溯、准确,适用于取证文档,解决了传统 ML 方法的“黑箱”问题。该研究适合安全分析师、取证调查人员以及 AI 安全研究者阅读。
💡 推荐理由: 该研究将 LLM 的推理能力与取证需求结合,显著提升了日志分析的样本效率和解释性,有望改善 SOC 的告警调查流程。
🎯 建议动作: 研究跟进