推荐 11.5
Conf: 50%
该论文提出LLMBisect,一种基于大语言模型(LLM)的自动化Bug二分定位比较分析流水线。传统的Bug二分定位依赖人工查看代码或手动执行测试,效率低下且容易出错。LLMBisect通过将Bug描述、代码差异和测试结果输入LLM,让模型推断出导致回归的提交。论文比较了多种LLM(如GPT-4、LLaMA、Claude等)在真实软件项目Bug定位任务上的表现,并设计了一套统一的评价指标(如准确率、平均定位步数)。实验结果表明,GPT-4在大多数场景下表现最佳,平均定位准确率超过85%,而更小的开源模型(如LLaMA-13B)经过微调后也能达到接近的效果。此外,论文分析了LLM在推理过程中的错误模式(如过度自信、误判依赖关系),并提出了改进提示词工程的方法。主要贡献包括:首次系统评估LLM在Bug二分定位任务上的能力,提出可复现的流水线架构,以及开源相关代码与数据集。该工作为自动化软件调试和DevOps流程提供了新的思路。
💡 推荐理由: Bug二分定位是软件安全与开发中的关键痛点,LLMBisect展示了LLM自动化该任务的可行性,能够显著减少人工成本,尤其适合安全团队快速定位回归漏洞。
🎯 建议动作: 研究跟进
排序因子: 来自网络安全顶级会议 (+8) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)