#bug-bisection 主题 - Cyber Security Daily Radar

👥 作者: Zheng Zhang, Haonan Li, Xingyu Li, Hang Zhang 0012, Zhiyun Qian

该论文提出LLMBisect，一种基于大语言模型（LLM）的自动化Bug二分定位比较分析流水线。传统的Bug二分定位依赖人工查看代码或手动执行测试，效率低下且容易出错。LLMBisect通过将Bug描述、代码差异和测试结果输入LLM，让模型推断出导致回归的提交。论文比较了多种LLM（如GPT-4、LLaMA、Claude等）在真实软件项目Bug定位任务上的表现，并设计了一套统一的评价指标（如准确率、平均定位步数）。实验结果表明，GPT-4在大多数场景下表现最佳，平均定位准确率超过85%，而更小的开源模型（如LLaMA-13B）经过微调后也能达到接近的效果。此外，论文分析了LLM在推理过程中的错误模式（如过度自信、误判依赖关系），并提出了改进提示词工程的方法。主要贡献包括：首次系统评估LLM在Bug二分定位任务上的能力，提出可复现的流水线架构，以及开源相关代码与数据集。该工作为自动化软件调试和DevOps流程提供了新的思路。

💡 推荐理由: Bug二分定位是软件安全与开发中的关键痛点，LLMBisect展示了LLM自动化该任务的可行性，能够显著减少人工成本，尤其适合安全团队快速定位回归漏洞。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

#bug-bisection

LLMBisect: Breaking Barriers in Bug Bisection with A Comparative Analysis Pipeline.