#few-shot-learning 主题 - Cyber Security Daily Radar

👥 作者: Yizhi Li, Jiang Li, Jiahao Cao 0001, Renjie Xie, Yangyang Wang 0001, Mingwei Xu 0001

边界网关协议（BGP）作为互联网事实上的域间路由协议，面临不断涌现的安全威胁，严重影响互联网可靠性。现有的基于机器学习的BGP威胁检测方法需要大量标注数据和专家参与，成本高且劳动密集，同时无法充分利用互联网上持续生成的海量未标注BGP数据。本文提出FIRE（Few-Shot Inter-Domain Routing Threat Detection with Large-Scale Multi-Modal Pre-Training），一种利用大规模多模态预训练实现少样本域间路由威胁检测的方法。FIRE通过设计领域特定的预训练任务，从大规模未标注BGP数据中获取丰富的BGP隐式知识，从而支持少样本学习。实验表明，FIRE仅需少量标注样本即可精确识别BGP威胁，例如在路由泄漏检测中，仅用8个事件进行微调即可达到93.2%的精确率。该方法降低了数据标注和专家知识的需求，为BGP安全检测提供了高效、低成本的解决方案。

💡 推荐理由: BGP威胁严重影响互联网可靠性，而现有检测方法成本高。FIRE利用大规模预训练和少样本学习，显著降低对标注数据和专家经验的依赖，为运营级BGP安全检测提供可行性方案。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Bernhard Kneip, Nhien-An Le-Khac, Hong-Hanh Nguyen-Le

该论文针对 Web 服务器日志的取证分析需求，提出了一种名为 CEF-Log 的上下文增强少样本思维链提示策略，用于大语言模型（LLM）。传统机器学习方法在日志检测中常被视为“黑箱”，难以提供符合法律要求的人类可读解释。CEF-Log 通过嵌入专家调查方法，设计了一个结构化的五步推理模板，引导模型学习如何分析日志，而非记忆特定模式。实验基于 CSIC 2010 数据集，仅使用四个示例便达到了 0.99 的 F1 分数，样本效率相比其他基于提示的方法提升了 10 倍。此外，论文还引入了新数据集 ForenWebLog，包含真实攻击和多步攻击序列，用于全面评估。定性分析表明，CEF-Log 生成的解释可追溯、准确，适用于取证文档，解决了传统 ML 方法的“黑箱”问题。该研究适合安全分析师、取证调查人员以及 AI 安全研究者阅读。

💡 推荐理由: 该研究将 LLM 的推理能力与取证需求结合，显著提升了日志分析的样本效率和解释性，有望改善 SOC 的告警调查流程。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Hossein Fereidooni, Jan König, Phillip Rieger, Marco Chilese, Bora Gökbakan, Moritz Finke, Alexandra Dmitrienko, Ahmad-Reza Sadeghi

该论文提出了一种名为 AuthentiSense 的可扩展行为生物特征身份验证方案，专门针对移动平台设计。传统的一次性身份验证技术（如密码、指纹、面部识别）存在被窃取或模仿的风险，且一旦设备解锁后无法持续保护用户隐私。为弥补这一缺陷，基于行为生物特征的连续身份验证方法应运而生。然而，现有方案要么无法动态适应用户基数的变化（即用户无关性差），需要重新训练模型，要么难以在数百万用户规模下高效运行。AuthentiSense 通过引入少样本学习技术（具体为孪生网络 Siamese Network）解决了这些挑战。该系统仅利用用户与移动应用交互时产生的运动模式数据（加速度计、陀螺仪、磁力计），无需人工特征工程或大量训练数据。该方法的核心创新在于其用户无关性：模型无需针对新增用户重新训练，只需少量行为样本（例如 3 个样本）即可完成注册和验证，从而支持大规模用户场景。论文通过系统性测量实验评估了多个参数的影响，包括身份验证所需的交互时间（仅需 1 秒）以及 n-shot 验证（与注册样本的比较次数）对识别性能的影响。令人瞩目的是，在 few-shot 设置下（每个用户仅 3 个样本），AuthentiSense 的 F1 分数高达 97%，误接受率（FAR）为 0.023，误拒绝率（FRR）为 0.057。该方案实现了高精度、低延迟和可扩展性，为移动设备上的连续身份验证提供了一种实用且高效的新途径。

💡 推荐理由: 此研究为移动端持续身份验证提供了高效、可扩展的少样本学习方案，有望提升用户隐私保护和账户安全，尤其对需要高安全性且用户规模大的应用场景有价值。安全从业者可关注其方法在防御侧的应用潜力。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Jack Wilkie, Hanan Hindy, Christos Tachtatzis, Miroslav Bures, Robert Atkinson

网络入侵检测系统（NIDS）通过检测恶意流量并交由安全运营中心调查，在保护网络中发挥关键作用。现有最先进的方法利用监督机器学习训练分类模型识别已知网络攻击，但这些模型需要大量标注数据集，且在较小数据集上训练时性能较差。为解决这一缺陷，异常检测模型学习正常流量分布并将不符合的流量标记为恶意——虽然不需要恶意样本训练，但误报率高，实用性低。因此，当特定攻击类别的标注实例不足时（例如新建立网络或出现未见过的攻击类型），网络可能特别脆弱。本文提出使用三元组网络（triplet network），结合在线三元组挖掘（online triplet mining）和K近邻（KNN）分类器，实现小样本（few-shot）分类，从而在仅用有限恶意样本训练后即可进行有效入侵检测。作者探索了多种在线三元组挖掘算法，并通过一系列消融实验比较和评估模型设计选择，如推理算法和优化的距离度量。最终模型在小样本二分类和多分类任务中与现有最先进方法进行比较，结果表明：在每类仅用10个恶意样本训练时，所提方法性能与现有方法相当。该工作为网络攻击检测中标注数据稀缺场景提供了新思路。

💡 推荐理由: 该研究针对小样本场景下的网络入侵检测问题，提出基于三元组网络的少样本学习方法，可显著降低对大量标注攻击样本的依赖，对新建网络或新型攻击出现时的快速检测具有重要参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

Cyber Security Daily Radar

#few-shot-learning

Poster: Few-Shot Inter-Domain Routing Threat Detection with Large-Scale Multi-Modal Pre-Training.

Sample-Efficient LLM-Based Detection of Malicious Web Server Logs with Forensically Explainable Reasoning

AuthentiSense: A Scalable Behavioral Biometrics Authentication Scheme using Few-Shot Learning for Mobile Platforms.

Few-Shot Network Intrusion Detection Using Online Triplet Mining