#program-representation

共收录 1 条相关安全情报。

← 返回所有主题
👥 作者: Andrew Stoltman, Johnathan Tang, Haipeng Cai

本论文针对大语言模型(LLM)用于自动化漏洞检测时,程序结构与语义信息的表示方式这一关键问题进行了实证研究。作者指出,当前的提示工程方法通常直接提供原始源代码,但这一做法缺乏理论支撑,且可能引入冗余信息导致推理效果下降。为此,论文构建了RepBench基准测试集,基于Joern工具从真实C/C++漏洞测试用例中提取多种程序表示:原始源码、抽象语法树(AST)、控制流图(CFG)、程序依赖图(PDG)及其组合,并特别增加了增强型PDG(ePDG)变体。实验采用来自PrimeVul的107个测试用例(覆盖5个CWE类别),在固定思维链(Chain-of-Thought)和结构化输出协议下评测了10种表示变体,外加19个额外ePDG用例。结果表明,表示选择显著影响LLM的漏洞推理能力。最佳组合AST+PDG达到83.2%的准确率,而原始源码仅53.5%。图结构提示(仅含图)在家族层面优于纯源码提示或源码+图提示,且所需提示长度更短。研究揭示了“上下文稀释效应”:向紧凑的结构化证据中添加原始源码,反而会降低关键漏洞信息的显著性,损害推理能力。总体而言,精心选择的结构化表示能够提供比简单增加原始输入更好的准确率-开销权衡,表明静态分析可作为安全聚焦型LLM推理的有效提示构造层。该工作对于理解如何优化LLM在代码安全任务中的输入表示具有重要指导意义。

💡 推荐理由: 本研究表明,直接给LLM喂原始源码并非最优做法,合理选择结构表示(如图或AST)能显著提升漏洞检测准确率。安全团队在构建AI辅助漏洞检测系统时,应优先考虑基于静态分析的结构化提示,而非盲目堆叠上下文。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)