#decompilation

共收录 4 条相关安全情报。

← 返回所有主题
推荐 5.5
Conf: 50%
👥 作者: Kaihua Qin, Dawn Song, Arthur Gervais

智能合约反编译旨在从字节码恢复高级语言源代码,但现有评估方法存在数据集狭窄、指标不一致、语义一致性检查有限等问题。随着大型语言模型(LLMs)开始生成看似合理但语义可能偏离原始合约的Solidity代码,这一问题变得日益重要。本文提出SCDBench,一个基于LLM的智能合约反编译器数据集和评估基准。数据集包含600个真实Solidity合约,配有其字节码输入、真实源代码和可重放的语义检查点。SCDBench通过四个递进阶段评估反编译输出:格式完整性、可编译性、应用程序二进制接口(ABI)恢复以及通过差分重放实现语义一致性。作者在零样本反编译设置下评估了Claude Opus 4.7、GPT-5.3-Codex和GLM-5(包括有无扩展推理的变体)以及零样本编译修复设置。结果表明,前沿LLM通常能生成结构清晰且可编译的Solidity代码,但实现语义一致性仍远未解决:最佳模型仅完美反编译42/600个合约。进一步实验表明,引入同模型编译修复以适度成本显著提升了性能。SCDBench为严格且可重复的评估建立了共同基础,旨在加速开发用于区块链安全与透明性的可靠智能合约反编译器。

💡 推荐理由: 该研究为评估LLM在智能合约反编译任务中的表现提供了标准化基准,填补了现有评估方法的空白,对区块链安全审计、漏洞检测和合约分析具有重要参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Alexander Shypula, Osbert Bastani, Edward Schwartz

反编译器是逆向工程中用于从编译后的二进制代码重构源代码的重要工具。然而,由于编译器在将人类可读的代码转换为低级机器码时,会丢失高级语法、标识符和自定义数据类型等信息,因此从编译后的二进制代码中重构源代码是一项具有挑战性的任务。传统的确定性反编译器虽然实用,但在推断惯用语法和标识符名称方面存在困难。生成式AI模型天然适合重构高级语法、标识符和类型,但可能会产生幻觉,生成不正确的编程结构和语义。本文提出了Decaf(DECompilation with Automated Feedback,自动反馈反编译)系统,其核心思想是:不是通过更多数据和更多训练来改进神经反编译器,而是利用编译器反馈通过搜索来大幅提升神经反编译器输出的语义正确性。具体地,Decaf在反编译器生成多个候选代码后,使用编译器对候选代码进行编译并检查是否与原始二进制代码在语义上等价(例如通过比较执行结果或二进制相似性),从而筛选出最符合语义的候选。实验基于ExeBench数据集,在Real -O2优化级别上,Decaf将神经反编译的成功率从26.0%提升至83.9%,且不牺牲与原始源代码的相似性。此外,该自动反馈方法对于较弱的神经反编译模型同样非常有效。该研究为机器学习驱动的反编译提供了新范式,证明了结合编译器反馈和搜索可以显著改善反编译质量,对于逆向工程、恶意软件分析、遗留代码理解等领域具有重要价值。

💡 推荐理由: 该研究通过编译器反馈与搜索机制,显著提升了神经反编译器的语义正确性,解决了传统方法依赖大量训练数据且容易产生幻觉的痛点,为逆向工程、恶意软件分析和二进制漏洞研究提供了更可靠的自动化工具。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Zhiping Zhou, Xiaohong Li 0001, Ruitao Feng, Yao Zhang 0019, Yuekang Li, Wenbu Feng, Yunqian Wang, Yuqing Li

反编译是将机器码转换为人类可读形式的关键技术,广泛应用于软件安全分析、漏洞挖掘和逆向工程。然而,现有反编译工具生成的代码常存在语义失真,导致可读性和准确性下降。传统方法如变量重命名或结构简化仅能提供局部改进,缺乏对复杂闭源二进制文件中语义错误的系统性检测与纠正能力。本文提出 FidelityGPT 框架,通过结合检索增强生成(RAG)与动态语义强度算法,实现反编译失真的自动检测与修复。FidelityGPT 的核心创新包括:针对闭源场景设计的失真感知提示模板、基于动态语义强度的失真行定位算法、以及通过变量依赖分析缓解长上下文限制的机制。实验基于二进制相似性基准测试中的 620 个函数对展开,结果表明 FidelityGPT 的平均检测准确率达 89%,精确率为 83%。与当前最先进的 DeGPT(修复率 83%,修正修复率 37%)相比,FidelityGPT 分别达到 94% 的修复率和 64% 的修正修复率,显著提升了反编译代码的准确性和可读性。该研究展示了大型语言模型结合检索增强在反编译与逆向工程领域的应用潜力,适用于需要处理复杂闭源二进制文件的安全分析场景。

💡 推荐理由: 反编译是安全分析的基础,FidelityGPT 显著提升了反编译代码的语义准确性,直接帮助安全分析师更高效地理解闭源二进制程序,降低误判风险。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Han Dai, Soumyakant Priyadarshan, Abdullah Imran, Ruoyu Wang, Antonio Bianchi

该论文提出了一种名为SCRIBE的实用静态二进制补丁框架,旨在解决在没有源代码或原始工具链时,通过解编译后重编译进行二进制补丁的困难。现有解编译器(如Hex-Rays)输出的代码存在大量语法和语义不准确,导致重编译失败或补丁不正确。SCRIBE采用“二进制感知”重编译方法,从原始二进制中提取信息来修复解编译器输出的语义错误,从而提高重编译成功率和补丁正确性。评估表明,SCRIBE修复了Hex-Rays解编译器产生的约81%的错误函数,并成功为14个真实CVE中的13个生成了补丁,无需访问源代码或手动编辑汇编。用户研究显示,使用SCRIBE的18名参与者补丁成功率为100%,而不用时仅3.7%。此外,三个大型语言模型在SCRIBE框架下均实现了100%的补丁成功率,展示了全自动补丁的潜力。该工作使源码级二进制补丁变得可靠且易用。

💡 推荐理由: 该工作为安全工程师提供了一种无需源码即可对二进制进行可靠补丁的方法,解决了解编译器不准确这一长期痛点,可显著提升漏洞应急响应和遗留系统维护效率。

🎯 建议动作: 研究跟进

排序因子: 有可用补丁/修复方案 (+3) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)