#language-model 主题 - Cyber Security Daily Radar

👥 作者: Shoya Otsu, Kei Suzuki, Toshiaki Koike-Akino, Jing Liu, Ye Wang

本论文提出了一种名为 CAPTAIN（Context-Augmented Perplexity-based Threat Activity log detectIoN）的 APT 检测方法。研究背景是高级持续性威胁（APT）检测的难点在于大规模日志中仅有极小部分事件是恶意的，传统方法依赖大量人工标注和复杂的预处理管道，工程成本高。CAPTAIN 利用预训练的语言模型，通过最小化领域无关的预处理，基于困惑度（perplexity）对日志条目进行评分。该方法的核心创新在于引入上下文增强机制：使用编码器模型和 Q-Former 风格的桥接结构对近期历史日志进行编码，生成紧凑的上下文令牌，注入到解码器输入中，使困惑度评分能够反映时间上下文信息。此外，CAPTAIN 还通过平滑滤波器对困惑度时间序列进行稳定化处理。在多个 APT 基准测试上，CAPTAIN 与强基线方法性能相当，且对非精细化预处理输入具有鲁棒性，从而显著降低了日志预处理的发展与运维成本。该工作表明，无需复杂的数据清洗即可实现有效的 APT 检测，为安全运营团队提供了一种轻量级、可扩展的解决方案。

💡 推荐理由: 降低 APT 检测对大量人工标注和复杂预处理管道的依赖，使语言模型能够直接用于原始日志，显著减少工程成本，对资源有限的蓝队团队极具吸引力。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Mahmood Sharif, Pubali Datta, Andy Riddle, Kim Westfall, Adam Bates 0001, Vijay Ganti, Matthew Lentz, David Ott

该论文提出 DrSec 系统，针对端点安全领域日益复杂的攻击以及现有安全产品（如 EDR）的碎片化问题——应用独立开发、误报率高、漏报、缺乏高质量标签——采用自监督学习预训练基础语言模型（LM）来处理事件序列数据。DrSec 输入进程的事件序列，输出进程的分布式表示（嵌入向量）。预训练后，LM 可通过少量或者无监督方式适配多种下游任务，统一当前分裂的应用生态。作者在包含约9100万进程和25.5亿事件的真实数据集上训练了两种 LM 架构，并在三个应用域（无监督进程识别、告警分诊、专家规则学习）中评估。实验表明：DrSec 能够准确进行无监督进程识别；在告警分诊任务上显著优于领先方法（例如精确率-召回率曲线下面积 75.11% vs. ≤64.31%），有效减少告警疲劳；还能准确学习专家开发的规则，从而允许调整事件检测器的误报和漏报率。论文的核心贡献在于证明了大规模自监督预训练能够生成通用且高效的进程表示，并促进端点安全中多种分析任务的一体化，减少对人工标注的依赖。

💡 推荐理由: DrSec 展示了如何用自监督语言模型统一多个端点安全应用，显著提升告警分诊效果，为 EDR 系统提供减少误报/漏报的新范式，值得安全运营团队和研究机构关注。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Shanghao Shi, Chaoyu Zhang, Heng Jin, Yang Xiao, Yevgeniy Vorobeychik, William Yeoh, Ning Zhang, Y. Thomas Hou, Wenjing Lou

这篇论文揭示了联邦学习（FL）在语言模型微调过程中的隐私后门攻击风险。在联邦学习中，多个参与者协作微调模型而不共享原始数据，但全模型微调计算成本高昂，因此参数高效微调（PEFT）成为实际应用中的主流方法，它冻结基础模型仅训练少量适配器。本文提出一种名为NeuroImprint的攻击方法，由恶意参数服务器实施，能够将PEFT适配器隐秘地转化为隐私后门，该后门隐式地记忆客户端的训练样本，以每个样本对应的隔离参数更新形式存储在单独的神经元中，且不降低模型效用。具体来说，NeuroImprint为每个训练样本分配一个专用的记忆神经元，并约束每个神经元在本地微调轨迹中最多更新一次，从而解决了大本地批次和有状态优化器（如Adam/AdamW）导致的交叉样本碰撞和交叉步骤混合问题。微调完成后，这些隔离的样本更新可以通过闭式解析方法逆向恢复为文本嵌入，并确定性地映射回 token 序列。作者在多种语言模型（BERT、GPT-2、Qwen2、Llama3.2）和四个不同领域的微调数据集上验证了该方法，结果显示攻击能够重构59%至79%的微调样本，且具有较高的语义保真度。该研究首次系统性地展示了在联邦语言模型微调中利用PEFT适配器实现隐私泄露的可行性，对联邦学习的安全隐私保护提出了新的挑战。

💡 推荐理由: 该研究揭示了联邦语言模型微调中一种隐蔽且高效的隐私攻击方式，直接威胁到使用PEFT的联邦学习系统的用户数据安全。安全从业者应关注此类针对适配器的后门攻击，并评估现有防御措施的不足。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Malikeh Ehghaghi, Boglárka Ecsedi, Marsha Chechik, Colin Raffel

本文提出了一种基于计算压力的对抗鲁棒性评估框架，用于衡量大型语言模型（LLM）在对抗性攻击下的实际安全性。传统的评估方法通常以固定查询预算下的攻击成功率（ASR）作为指标，忽略了不同攻击策略在计算开销上的巨大差异（可能相差数个数量级）。为解决这一问题，作者引入累积浮点运算次数（FLOPs）作为攻击成本的代理，提出了风险-计算曲线（risk-compute curves），将计算预算映射到攻击风险，并推导出两个总结指标来量化攻击成功所需的平均压力。在10个不同模型（涵盖3个模型系列、4个训练和对齐阶段）上，使用三种攻击策略（基于梯度的、迭代细化的、基于模板的）对两个越狱鲁棒性基准进行了评估。主要发现包括：（1）对齐训练在计算空间鲁棒性上表现出非单调效应；（2）增大模型规模能降低基于梯度的攻击有效性，但对成本更低的模板攻击影响有限；（3）基于梯度的攻击在代理模型上优化后可迁移到另一个目标模型，从而降低攻击者成本；（4）在单个模型内，不同危害类别的计算成本差异可达约5倍；（5）安全对齐的强化学习增加了总体成本，但使某些类别不成比例地更容易被攻击。作者开源了该框架以支持计算感知的风险评估。

💡 推荐理由: 为LLM对抗鲁棒性评估引入了计算成本维度，使安全从业者能更真实地衡量攻击的实际可行性，指导防御资源分配。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)

👥 作者: Vivek Kumar Sharma

该论文提出了一种名为PLM-NIDS的协议语言模型网络入侵检测系统，其核心思想是将网络流视为一种语言，其语法完全由L3/L4数据包元数据（长度、到达间隔时间、TTL、TCP标志和哈希端口号）构成，从而避免了对加密载荷的深度包检测（DPI）。作者首先证明了良性网络流存在可学习的语法结构：使用RWKV-4状态空间模型在344,232个未标记的Monday流数据上训练，因果语言模型验证损失达到0.204，表明良性流量具有可预测的统计一致性。其次，攻击行为违反了该语法：在无攻击标签训练的情况下，每个流的困惑度（perplexity）得分能干净地区分良性和攻击流，PR-AUC达到0.93。第三，这种分离能力在架构上是非平凡的：在相同输入序列上训练的LSTM退化为多数类预测器（ROC-AUC约0.50，F1=0.91，始终预测攻击），证明RWKV的因果预训练提供了直接分类器无法获得的归纳偏置。监督微调进一步将PR-AUC提升至0.94，ROC-AUC达到0.75，在标定操作阈值上精确度为97.7%。RWKV骨干的O(T)循环推理使得无需流缓冲即可进行逐包流式处理，从而使PLM-NIDS在线速下操作可行。由于仅读取IP/TCP/UDP头部，该方法本质上是加密无关的，可透明处理TLS 1.3、QUIC及未来加密协议。

💡 推荐理由: 为加密流量下的入侵检测提供了全新思路，无需解密即可通过元数据语义发现攻击，解决了传统NIDS在加密流量面前的失效困境。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)

👥 作者: J. Vijayavallabh

本文对 Anchored Decoding 中使用的 k-NAF (k-ary Normalized Attention Flow) 预算核算机制进行了实证审计。研究采用两类实验：一是固定、类别分层的负载（约 8500 次随机执行，覆盖六种提示类别），二是针对高代理支出比率的自适应提示搜索流程。在固定负载下，平均累积 KL 散度远低于序列级预算 K（K=600 和 1000），且基于经验 Bernstein 风格的代理指标在所有类别中均低于 K；表面重叠诊断（ROUGE-L 和 5-gram Jaccard）相应较小。自适应搜索提高了代理支出比率，但未导致预算明显耗尽。在 k=3 的保留版权域负载中，一些提示在早期停止评估且实现样本量较小时，代理比率超过 1；使用更大分配重新评估相同提示后，在可比平均支出下代理比率降至 [0.26, 0.40] 范围，这更符合代理伪影而非每条轨迹的预算失败。因此，该机制在实践中有效，未发现系统性预算违规。

💡 推荐理由: 该论文实证评估了 Anchored Decoding 中防止超额计算的关键预算机制，对 LLM 服务的安全性（如拒绝服务防护、成本控制）具有参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

Cyber Security Daily Radar

#language-model

Beyond Heavy Log Curation: Perplexity-Based APT Detection via Unsupervised, Context-Augmented Language Models

DrSec: Flexible Distributed Representations for Efficient Endpoint Security.

From Efficiency to Leakage -- Privacy Backdoor in Federated Language Model Fine-Tuning

Risk Under Pressure: Compute-Aware Evaluation of Adversarial Robustness in Language Models

A Protocol-Language Model for Network Intrusion (Without Deep Packet Inspection)

An Empirical Audit of k-NAF Budget Accounting for Anchored Decoding