软件漏洞是严重的安全威胁,仅2025年报告的CVE数量就接近5万个。大型语言模型在自动化漏洞检测方面展现出潜力,但仍面临三大挑战:一是生成的漏洞报告误报率高且缺乏可重复验证;二是现有的LLM方法在漏洞定位时粒度选择次优,函数级分析在上下文过多时容易遗漏漏洞,而行级分析则缺乏足够的上下文;三是难以推理具有复杂跨函数依赖和触发条件的漏洞。针对这些问题,本文提出了FuzzingBrain V2,一个基于多智能体LLM的系统,其核心贡献包括:(1) 基于Google的OSS-Fuzz实现完全自动化的漏洞分析,确保所有报告的漏洞都可通过模糊测试复现;(2) 提出Suspicious Point这一基于控制流的新型抽象,实现最优粒度的精确漏洞定位;(3) 采用逻辑驱动的层次化函数分析与双层模糊测试,在资源约束下增强函数覆盖;(4) 基于MCP的静态和动态分析工具结合上下文工程,增强复杂漏洞的推理能力。在AIxCC 2025决赛的C/C++数据集上,FuzzingBrain V2实现了90%的检测率(40个漏洞中检测到36个)。在实际部署中,该工具在12个开源项目中发现了29个零日漏洞,所有漏洞均被维护者确认并修复,其中2个已分配CVE编号。
💡 推荐理由: 该研究提出了一种可复现、低误报的自动化漏洞发现系统,结合多智能体LLM与模糊测试,显著提升了真实世界漏洞检测效率,对蓝队和安全工程师评估LLM在漏洞挖掘中的实用性具有直接参考价值。
🎯 建议动作: 研究跟进