推荐 5.5
Conf: 50%
本文提出 FunFuzz,一个基于大型语言模型(LLM)的进化模糊测试框架,旨在解决传统 LLM 驱动模糊测试中 prompt 初始化和采样方差导致的探索效率低下和输入冗余问题。FunFuzz 采用多岛进化算法,并行运行多个隔离的搜索过程,并定期迁移高价值候选输入以维持种群多样性。初始生成 prompt 从文档中提取,每个岛屿使用特定主题的指令初始化,随后通过反馈引导的 prompt 选择机制持续调整 prompt。在模糊测试过程中,候选输入根据增量编译器覆盖率进行排序,同时利用编译器内部失败信号识别崩溃触发输入。在 GCC 和 Clang 编译器上的 24 小时连续实验表明,FunFuzz 相比之前的 LLM 驱动基线方法实现了更高的编译器覆盖率,并发现了更多独特的编译器内部失败触发输入。该方法有效结合了 LLM 的输入生成能力和进化算法的全局搜索能力,为编译器等结构化输入场景的模糊测试提供了新思路。
💡 推荐理由: FunFuzz 将 LLM 与进化算法有机结合,显著提升了编译器模糊测试的覆盖率和缺陷发现能力,对于软件安全测试领域具有创新意义。
🎯 建议动作: 研究跟进
排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)