推荐 3.7
Conf: 50%
本文研究了概念漂移(Concept Drift)对基于机器学习的钓鱼检测系统性能的影响,并提出了缓解策略。随着数字通信的快速发展,电子邮件成为主要渠道之一,但也带来了垃圾邮件和钓鱼攻击的持续威胁。传统的机器学习检测模型在静态数据集上表现良好,然而钓鱼攻击技术不断演化,导致数据分布随时间发生变化,即概念漂移,从而造成模型性能显著下降。作者评估了多种机器学习模型(如逻辑回归、随机森林、支持向量机等)在真实邮件数据集上随时间推移的准确率、召回率等指标的变化,发现多数模型在6-12个月后准确率下降超过10%。为此,本文提出了一种自适应重训练框架,结合周期性增量更新和基于漂移检测的触发式重训练策略。实验表明,该框架能够将检测性能下降幅度控制在3%以内,同时降低了频繁重训练的计算开销。研究还分析了不同特征(如邮件头、内容、元数据)对漂移的敏感性,指出基于内容的特征更容易受漂移影响。该工作为安全运维团队提供了实用的模型维护指南。
💡 推荐理由: 揭示了机器学习钓鱼检测模型在实际部署中因概念漂移而失效的风险,并给出了可行的自适应维护方案,对保障长期检测有效性至关重要。
🎯 建议动作: 研究跟进
排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.7)