#harness-generation 主题 - Cyber Security Daily Radar

👥 作者: Xing Zhang, Zikang Huang, Gang Yang, CongChong Wang, Lu Liu, Bin Yin, Mingyi Wang, Ziquan Zhao, Min Li, Zhenyu Chen, Bo Wu, Lingyun Ying

该论文提出 SynapseFlow，一种基于状态机引导的自动化模糊测试 harness 生成工具，旨在解决现有大语言模型（LLM）单轮生成方法中因函数粒度过粗和生成流程错位导致的幻觉及覆盖率不足问题。SynapseFlow 的创新包括两点：一是数据流感知的函数聚合，通过分析源代码构建结构流图（Structural Flow Graph）并提取连贯的函数三元组（Function Triplets）；二是采用分阶段且支持回滚的生成工作流分解，将 harness 合成过程分为四个阶段，并由分阶段回滚算法确保正确性。在 25 个真实世界开源软件项目上的实验表明，SynapseFlow 在分支覆盖率和漏洞发现率上显著优于现有工具（OSS-Fuzz-Gen、CKGFuzzer、PromeFuzz），分支覆盖率分别提升 3.07、1.71、4.26 倍，漏洞发现率分别提升 1.77、1.51、1.36 倍。更重要的是，SynapseFlow 发现了 7 个此前未报告的漏洞（其中 5 个已分配 CVE），证明了其在真实场景中的实用效果。该研究适合安全测试工程师、模糊测试研究人员和 LLM 自动化工具开发者阅读。

💡 推荐理由: 高质量 fuzz harness 是高效灰盒模糊测试的关键瓶颈，SynapseFlow 利用 LLM 结合数据流分析与分阶段工作流，显著提升了自动化生成质量，并在真实项目中发现了多个新漏洞，证明了实用价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)

👥 作者: Ze Sheng, Dmitrijs Trizna, Luigino Camastra, Zhicheng Chen, Qingxiao Xu, Jeff Huang

本文针对C/C++软件中模糊测试（fuzz testing）的关键瓶颈——fuzz harness（连接模糊器和库API的程序）的正确性问题，提出了一种自动化生成高质量harness的系统QuartetFuzz。现有的自动化harness生成工具无法系统性地确保harness的正确性，导致逻辑错误、API误用和生命周期违规等问题在源代码层面被忽视。随着基于大语言模型（LLM）的生成技术使harness创建规模化，缺乏质量控制反而使规模成为负担。QuartetFuzz的核心是四个原则框架：逻辑正确性（P1）、API协议合规（P2）、安全边界尊重（P3）和入口点充分性（P4），这是首个在源代码层面定义harness正确性的框架，包含数学规范与可实现的检查。该系统将这四个原则操作化为一个自主LLM智能体，通过“生成-检查-修复”循环，在模糊测试开始前确保生成的harness满足P1-P4。在涵盖C/C++、Java和JavaScript的23个开源项目上部署后，系统提交了42个漏洞报告，其中29个已被上游修复或确认（包括3个CVE），仅有2个被拒绝（误报率4.8%）。在生成过程中，内置的P1/P2检查自动拦截了58个由harness引起的崩溃，否则这些崩溃将成为误报。当作为质量审核工具应用于70个项目的586个现有生产环境harness时，系统识别出53个违规（45个已确认，35个已修复）。此外，作者发布了包含100个标注harness的数据集以供可复现评估。该工作对于提升模糊测试的有效性、减少误报、以及自动化安全测试基础设施有重要意义。

💡 推荐理由: 该研究首次从源代码层面定义并实现了fuzz harness的正确性框架，解决了LLM生成harness时质量失控的问题，显著降低了模糊测试中的误报率，并已产出实际漏洞修复（含3个CVE），对安全测试工程师和自动化工具开发者具有直接参考价值。

🎯 建议动作: 研究跟进

排序因子: 有可用补丁/修复方案 (+3) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

Cyber Security Daily Radar

#harness-generation

Thinking More, Harnessing Better: State Machine Guided Harness Automatic Generation with Project Digestion and Workflow Decomposition

Quality-Assured Fuzz Harness Generation via the Four Principles Framework