推荐 8.5
Conf: 50%
本文提出了一种基于根因驱动的自动化漏洞修复系统Kumushi。当前基于LLM的修复系统面临两个主要挑战:一是缺乏对bug来源的强信号,导致修复仅针对表面症状(如使测试通过)而未解决根本问题;二是根因定位本身困难,即使是熟悉代码库的开发者也常修复症状而非根因,LLM代理则因上下文噪声和程序理解不足而更差。Kumushi通过结合多样化动态故障定位与证据加权排序,将LLM聚焦于与缺陷最相关的代码,从而生成根因修复。为了严格评估补丁质量,作者还引入了双层补丁质量度量:结合自动化oracle验证与结构化专家评估。在178个C/C++漏洞上的实验表明,Kumushi在自动化评估中显著优于先前的专业修复代理,并与前沿商用编程代理性能相当。专家评估揭示了oracle无法区分的差异:Kumushi生成更多根因修复和更少表面补丁,在多数成对比较中被专家优先选择。这些结果表明自动漏洞修复的进步不仅需要更强的修复系统,还需要能区分真正修复与仅通过oracle的修复的更丰富评估方法。
💡 推荐理由: 为LLM驱动的自动漏洞修复提供了根因优先的新范式,并通过更精细的评估方法区分真正修复与表面修复,对提升软件安全修复质量具有重要参考价值。
🎯 建议动作: 研究跟进
排序因子: 有可用补丁/修复方案 (+3) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)