#program-representation 主题 - Cyber Security Daily Radar

👥 作者: Andrew Stoltman, Johnathan Tang, Haipeng Cai

本论文针对大语言模型（LLM）用于自动化漏洞检测时，程序结构与语义信息的表示方式这一关键问题进行了实证研究。作者指出，当前的提示工程方法通常直接提供原始源代码，但这一做法缺乏理论支撑，且可能引入冗余信息导致推理效果下降。为此，论文构建了RepBench基准测试集，基于Joern工具从真实C/C++漏洞测试用例中提取多种程序表示：原始源码、抽象语法树（AST）、控制流图（CFG）、程序依赖图（PDG）及其组合，并特别增加了增强型PDG（ePDG）变体。实验采用来自PrimeVul的107个测试用例（覆盖5个CWE类别），在固定思维链（Chain-of-Thought）和结构化输出协议下评测了10种表示变体，外加19个额外ePDG用例。结果表明，表示选择显著影响LLM的漏洞推理能力。最佳组合AST+PDG达到83.2%的准确率，而原始源码仅53.5%。图结构提示（仅含图）在家族层面优于纯源码提示或源码+图提示，且所需提示长度更短。研究揭示了“上下文稀释效应”：向紧凑的结构化证据中添加原始源码，反而会降低关键漏洞信息的显著性，损害推理能力。总体而言，精心选择的结构化表示能够提供比简单增加原始输入更好的准确率-开销权衡，表明静态分析可作为安全聚焦型LLM推理的有效提示构造层。该工作对于理解如何优化LLM在代码安全任务中的输入表示具有重要指导意义。

💡 推荐理由: 本研究表明，直接给LLM喂原始源码并非最优做法，合理选择结构表示（如图或AST）能显著提升漏洞检测准确率。安全团队在构建AI辅助漏洞检测系统时，应优先考虑基于静态分析的结构化提示，而非盲目堆叠上下文。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

#program-representation

Representation Matters: An Empirical Study of Program Representations for LLM Vulnerability Reasoning