#binary analysis 主题 - Cyber Security Daily Radar

👥 作者: Yufei Du, Omar Alrawi, Kevin Z. Snow, Manos Antonakakis, Fabian Monrose

该论文探讨了从二进制文件中恢复编译器来源信息（包括编译器家族、优化级别以及所应用的单个编译器pass）并用于增强安全任务的方法。现代编译器支持的复杂优化使得在多层次上恢复编译器来源成为可能。研究者利用来自超过27,000个使用LLVM 14编译的程序的数据，训练并评估了一个多标签编译器来源模型，该模型考虑了68个不同的编译器pass，平均F1分数达到84.4%。论文首先应用该模型来评估编译器引入的漏洞规模，在10个流行项目中识别出53个信息泄露缺陷。此外，研究显示多个编译器优化pass引入了大量功能代码重用小工具（gadgets），对安全性产生负面影响。除了漏洞检测，论文还评估了其他安全应用，包括利用恢复的来源信息验证Windows二进制文件中Rich header数据的正确性（用于取证分析），以及用于二进制分解任务（如第三方库检测）。该工作展示了编译器来源信息在多种安全场景中的实用价值，为二进制安全分析提供了新视角。

💡 推荐理由: 该研究揭示了编译器优化过程可能引入安全隐患，并提供了利用编译器来源信息提升漏洞检测、二进制取证和库识别能力的方法，对蓝队和安全分析师具有参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.6)

👥 作者: Zeyu Gao, Junlin Zhou, Songtao Yang, Chao Zhang 0008

本文提出了一种名为CiRCLE的方法，用于在二进制程序分析中恢复复杂的数据结构，克服了现有方法因碎片化导致的局限性。该方法通过结合静态分析和动态分析技术，能够识别并重建程序中使用的结构体、数组等高级数据类型。实验结果表明，CiRCLE在多个真实世界二进制程序上取得了较高的准确率和召回率，显著优于现有基线方法。该研究对于提升逆向工程、漏洞挖掘和恶意软件分析等领域的效率具有重要意义。

💡 推荐理由: 对于安全分析师和逆向工程师，准确恢复数据结构是理解程序行为的关键，该方法提供了更可靠的自动化手段，有助于提升漏洞分析和恶意软件逆向的效率。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Maitha Alshaali, Wanqing Tu, Gaofei Huang, Mthandazo Ndhlovu

本文提出并评估了一种名为二进制与系统集成安全分析（BSISA）的方法，用于分析QUIC协议实现的安全性。传统QUIC安全分析仅关注捕获的网络流量，而忽略了编译后二进制代码中的防御机制是否真正存在且在攻击时生效。BSISA将二元级分析（分析编译后的QUIC服务器二进制文件）与系统级分析（分析捕获的网络流量）相结合，在四个生产级QUIC服务器实现（如picoquic、quiche等）上，针对六种攻击场景（如Slowloris、连接ID耗尽等）进行了测试。总共24个测试单元（4个实现×6种攻击）中，只有组合分类器（BSISA）在每个攻击场景中至少正确分类了一个单元，总体准确率达45.8%，高于单独二进制分析（37.5%）和单独系统级分析（25.0%）。BSISA还能识别出编译二进制中负责吸收攻击的具体防御函数，并标记出“声明但沉默的防御”——即代码中存在但攻击时从未执行的防御例程（例如，四个实现中有三个的Retry-token验证、quiche中的抗放大机制），这类发现仅靠网络抓包无法获得。在效率方面，picoquic在Slowloris和连接ID耗尽攻击下分别丢失72.4%和73.3%的合法客户端连接，而其他三个实现将失败率控制在0.5%以下。本文的核心贡献在于提出了一种混合方法，能够更全面地评估QUIC实现的实际安全性，弥补了纯网络流量分析的不足，并为IoT固件中QUIC部署的安全评估提供了新工具。读者包括QUIC协议安全研究人员、IoT固件开发者和网络安全评估工程师。

💡 推荐理由: QUIC协议在IoT等资源受限环境中广泛部署，但其实现的安全性缺乏二进制级验证。BSISA方法揭示了标准声明的防御在编译后可能失效或从未执行，这一问题仅靠网络流量分析无法发现，对确保真实世界的QUIC安全至关重要。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Binbin Liu, Junfu Shen, Jiang Ming 0002, Qilong Zheng, Jing Li 0047, Dongpeng Xu 0001

混合布尔算术（MBA）混淆是一种广泛用于软件知识产权保护的技术，通过将简单表达式转换为复杂的布尔算术混合形式来增加逆向工程难度。然而，现有的MBA简化方法在效率或通用性上存在不足，例如无法处理高阶或嵌套的MBA表达式。本文提出MBA-Blast，一种新颖的MBA简化方法，其核心思想包括：（1）通过循环（loop）重写技术将MBA表达式转化为更适合SAT求解器处理的形式；（2）利用SAT求解器的强大能力来寻找简化后的等价表达式；（3）结合代数重写规则进一步精简结果。作者在多个基准测试集上进行了实验，包括真实软件中的混淆代码，结果显示MBA-Blast在简化成功率和运行时间上均显著优于现有工具（如MBA-Solver、SimplifyMBA等），尤其在处理高阶（如5阶以上）和复杂嵌套表达式时表现突出。该方法不仅能够完全简化大多数MBA表达式，还能输出简化的明文表达式，为逆向工程和恶意软件分析提供了有力支持。该研究主要由学术团队完成，代码已开源，便于社区进一步验证和应用。

💡 推荐理由: 帮助蓝队和安全分析师快速剥离代码中的MBA混淆层，提升对恶意软件或闭源软件的逆向分析效率。

🎯 建议动作: 关注开源项目并测试其在恶意软件样本上的去混淆效果。

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.6)

👥 作者: Antonio Flores-Montoya, Junghee Lim, Adam Seitz, Akshay Sood, Edward Raff, James Holt

该论文提出了一种新的反汇编算法，该算法将反汇编问题转化为加权区间调度问题，并利用学习得到的权重进行指令选择。反汇编是逆向工程、二进制重写等二进制分析和转换技术的第一步。现有的反汇编方法通常包含三个阶段：探索阶段（过度近似二进制代码）、分析阶段（为候选指令或基本块分配权重）以及冲突解决阶段（从候选集中选择最终的指令集）。本文提出了一种适用于多种架构（x86、x64、arm32、aarch64）的通用反汇编算法，其核心创新在于采用了一种新的冲突解决方法，即通过加权区间调度来减少反汇编问题。该方法将指令视为区间，每个区间有对应的权重，然后通过求解最大权重不重叠区间集合来得到最终的反汇编结果。权重可以通过学习得到，从而提升反汇编的准确性。实验部分（摘要未提及，但论文应有）展示了该方法在不同架构上的有效性，与现有方法相比具有竞争力。该研究为反汇编领域提供了一种新的视角，有望提升二进制分析工具的效率和准确性。

💡 推荐理由: 反汇编是二进制安全分析的基础，本文提出的通用算法能提升跨架构的反汇编准确性和效率，对逆向工程、漏洞分析和二进制重写等工具有重要影响。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

Cyber Security Daily Radar

#binary analysis

Improving Security Tasks Using Compiler Provenance Information Recovered At the Binary-Level.

CiRCLE: Recovering Complex Data Structures in Binaries Beyond Fragmentation.

A Binary and System Integrated Analysis Approach for Securing the QUIC Protocol

MBA-Blast: Unveiling and Simplifying Mixed Boolean-Arithmetic Obfuscation.

Disassembly as Weighted Interval Scheduling with Learned Weights.