#llm-vulnerability-detection 主题 - Cyber Security Daily Radar

👥 作者: Maofei Chen, Laifu Wang, Yue Qin, Yuan Wang, Bo Wu, Dongxin Liu

该论文系统性地研究了代码表示格式（原始源代码与剪枝抽象语法树 AST）如何影响跨语言大语言模型（LLM）在漏洞检测中的误报行为。作者使用两个 8B 参数级别的 LLM（Qwen3-8B 和 Llama 3.1-8B-Instruct），在 NIST Juliet Test Suite v1.3 的 C/C++ 数据上微调，然后在 Java（OWASP Benchmark v1.2）和 Python（BenchmarkPython v0.1）上评估。实验发现，仅使用原始文本进行微调时，跨语言误报率（FPR）随训练强度单调上升（例如 Qwen3-8B 从零样本的 0.763 上升到小规模微调的 0.866 再到全量微调的 1.0），而 F1 分数却保持稳定（0.637-0.688），掩盖了性能崩溃。作者认为主要机制是“表面线索记忆”：文本微调使得模型将 C/C++ 特有的 API 名称和语法惯用语编码为漏洞触发模式，在目标语言代码上产生大量误报。通过交叉表示探针实验（将文本训练权重直接应用于 AST 编码输入，无需重新训练），Qwen3-8B 的 FPR 从 0.866 骤降至 0.583，且 37.2% 的误报转变为真负。然而，直接使用 AST 进行微调并不能保持这种优势（FPR 至少 0.970），因为 AST 的扁平线性化引入了自身的结构表面线索。该模式在两个模型家族中均得到验证。在 Python 数据集上，AST 探针的 FPR 为 0.554，与 Java 结果仅差 2.9 个百分点，这一发现弱化了域偏移解释。基于这些发现，作者提出了一种部署前一致性门控机制：同时通过文本和 AST 两条路径运行告警，作为无需重新训练的误报敏感场景过滤器，但以牺牲部分召回率为代价。

💡 推荐理由: 该研究揭示了跨语言 LLM 漏洞检测中误报率攀升的根源——表面线索记忆，并提出了无需重新训练的缓解思路，对于构建可靠的多语言安全工具具有重要指导意义。

🎯 建议动作: 研究跟进，评估一致性门控机制在自己场景中的有效性；考虑在部署前加入文本与 AST 双路径告警对比的过滤环节。

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

#llm-vulnerability-detection

How Code Representation Shapes False-Positive Dynamics in Cross-Language LLM Vulnerability Detection