#imbalanced-learning 主题 - Cyber Security Daily Radar

👥 作者: Abu Fuad Ahmad, Istiaque Ahmed

该论文针对网络入侵检测系统（NIDS）在高维、高度不平衡流量场景下的特征选择问题，提出了一种名为nCMD（benign-anchored Classwise Mean Deviation）的轻量级、可解释的特征选择方法。传统过滤方法使用全局统计量（如卡方检验、互信息）对称地跨类别计算特征得分，无法捕捉入侵检测中攻击流量是主导良性流量偏离的本质。nCMD基于良性类锚定思想，将每个攻击类别的分布与良性类均值比较，计算特征对偏离程度的贡献，从而更贴合NIDS的操作语义，且不增加计算成本。在CICIDS2017、CICDDoS2019、NSL-KDD和UNSW-NB15四个基准数据集上，结合不同特征预算和三种下游分类器（如决策树、随机森林、逻辑回归），nCMD在宏平均F1得分上匹配或优于经典过滤方法，并在四个数据集中的三个上取得最佳结果，尤其在特征预算紧张和严重类别不平衡时提升显著。实验表明，nCMD作为资源受限NIDS的预处理组件具有可扩展性和可解释性。

💡 推荐理由: 为网络安全运维中高维不平衡流量提供了一类高效、可解释的特征选择新思路，有助于提升NIDS在资源受限环境下的检测精度和可解释性。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Yuteng Zhang, Huifang Ma, Jiahui Wei, Qingqing Li, Yafei Yang

软件漏洞检测对于确保软件安全性和可靠性至关重要。尽管深度学习取得了进展，但真实世界的漏洞数据集面临两个严重挑战：频率不平衡（少数类漏洞样本稀少）和难度不平衡（易检测与难检测样本的区分度不足）。本文从嵌入几何的角度重新审视这些问题，观察到这种不平衡会在超球面表示空间中引起几何失真，导致决策边界不稳定。为解决这一问题，作者提出了MARGIN（Margin-Aware Regularized Geometry for Imbalanced Vulnerability Detection），一个基于度量的框架，通过自适应边界度量学习和超球面原型建模来学习具有判别性的漏洞表示。MARGIN根据von Mises-Fisher浓度估计的分布结构动态调整几何正则化，使嵌入分布的概率质量与其对应的Voronoi单元对齐，从而减少几何失真，产生更稳定的决策边界。在多个公开漏洞数据集上的实验表明，MARGIN一致优于强基线，尤其在具有挑战性的不平衡数据集上，分类和检测性能显著提升。进一步分析显示，MARGIN产生的嵌入几何结构更有序，提高了鲁棒性、可解释性和泛化能力。

💡 推荐理由: 该研究针对现实漏洞检测中数据不平衡的痛点，提出了一种新的几何正则化方法，能有效提升模型在不均衡数据集上的检测性能，对安全自动化分析有重要参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)

Cyber Security Daily Radar

#imbalanced-learning

nCMD: Benign-Anchored Feature Selection for Imbalanced Network Intrusion Detection

MARGIN: Margin-Aware Regularized Geometry for Imbalanced Vulnerability Detection