#reverse-engineering

共收录 14 条相关安全情报。

← 返回所有主题
👥 作者: Luke Dramko, Claire Le Goues, Edward J. Schwartz

本文提出了一种名为 IDIOMS 的神经反编译框架,旨在解决传统反编译工具因编译信息丢失而无法恢复变量名、类型名等代码可读性特征的问题。现有神经反编译方法在处理真实代码时存在严重局限,例如无法为用户自定义的复合类型提供类型定义。IDIOMS 通过一种简单且可泛化的方法,对任意大型语言模型(LLM)进行微调,使其成为能够同时生成反编译代码和相应用户自定义类型定义的神经反编译器。此外,作者创建了名为 REALTYPE 的新数据集,其中包含比现有基准更复杂和真实的类型。实验表明,在最具挑战性的现有基准 EXEBENCH 上,IDIOMS 达到了 54.4% 的准确率,优于 LLM4Decompile 的 46.3% 和 Nova 的 37.5%;在 REALTYPE 数据集上,IDIOMS 的性能至少提升 95%。该研究对逆向工程和安全分析领域具有重要价值。

💡 推荐理由: 神经反编译有望大幅提升逆向工程效率,但现有方法无法处理真实代码中的自定义类型。IDIOMS 通过简单有效的微调框架解决了这一痛点,并提供了更高质量的数据集,为安全分析工具的实际落地迈出了关键一步。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Pietro Borrello, Catherine Easdon, Martin Schwarzl, Roland Czerny, Michael Schwarz 0001

本文提出了第一个针对 Intel 微码的静态和动态分析框架。微码是 x86 处理器内部用于将复杂指令分解为简单微操作的抽象层,但 Intel 对其细节保密,且微码补丁经过签名和加密以防止未授权修改。此前研究已恢复 Goldmont (Atom) 微码的明文和逆向工程调试机制,使得分析和定制成为可能。本文在此基础上,逆向工程了 Goldmont 微码的语义并重建了补丁原语。静态分析方面,实现了 Ghidra 处理器模块用于反编译和分析解密后的微码;动态分析方面,创建了 UEFI 应用程序,可以在 Goldmont 系统上跟踪和修补微码以提供完全控制。利用该框架,作者逆向工程了 Intel 机密微码更新算法,并对其设计和实现进行了首次安全分析。通过三个案例研究展示了微码定制的潜在安全和性能优势:首次实现了 x86 指针认证码 (PAC) 微码实现及安全评估;设计并实现了比标准断点快 1000 倍以上的快速软件断点;以及常量时间微码除法,展示了微码定制的安全性提升。

💡 推荐理由: 该工作首次实现了对 Intel 微码的全面逆向和安全分析,暴露了微码层潜在的安全和可靠性风险,为硬件安全研究提供了关键工具,并展示了微码定制在防御(如 PAC)和性能优化上的价值。

🎯 建议动作: 研究跟进

排序因子: 有可用补丁/修复方案 (+3) | 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Alexander Hepp, Matthias Ludwig, Michaela Brunner, Johanna Baehr, Georg Sigl

本文提出CRESS(通用反向工程评分系统),旨在量化硬件反向工程(RE)相关攻击场景的脆弱性。微电子系统的安全依赖于可信的供应链和设计流程,但全球分布的供应链或设计缺陷可能导致硬件层面攻击,如伪造、硬件木马或设备攻击。这些攻击常依赖硬件反向工程结果。现有CVSS(通用漏洞评分系统)虽广泛用于软件漏洞,但无法充分评估RE场景的独特性。本研究将原先定性的CRESS系统扩展为定量系统:通过与领域专家深度访谈,推导出不同RE攻击类别的权重,形成量化方程,输出CRESS分数以指示场景严重性。为验证有效性,对六个案例进行了定性和定量评估。结果表明,CRESS分数比CVSS更具表达力,能更一致地评估新场景并支持制定有效对策。本文适合硬件安全工程师、供应链安全分析师及漏洞评估研究人员阅读。

💡 推荐理由: CRESS为硬件反向工程攻击场景提供了首个标准化定量评分,弥补了CVSS在硬件安全评估中的不足,有助于统一威胁评级和优先级排序。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Zheng Zhong, Ruoyu Wu, Junpeng Wan, Muqi Zou, Dave (Jing) Tian

本文针对深度神经网络(DNN)二进制的逆向工程攻击提出了一种加固方案。DNN模型因其训练过程中涉及的专业知识、机密数据和高昂开发成本而成为专有资产。经过充分训练的DNN模型通常被编译成DNN二进制文件,以便在边缘设备、云基础设施等各种平台上高效执行。然而,近期关于DNN二进制反编译的研究表明,通过二进制逆向工程技术窃取DNN模型是可行的。虽然混淆是阻碍二进制逆向的成熟技术,但由于DNN二进制具有独特的结构特性(如权重参数、层结构等),通用混淆方案无法有效隐藏其中的信息。为此,本文设计了一种针对DNN二进制的专门加固方法,在保持模型推理性能的同时,显著提高攻击者逆向分析和提取模型参数的难度。实验结果表明,该方法能有效抵御多种逆向攻击,且引入的运行时开销较低。该研究为保护DNN模型的知识产权提供了新的技术手段。

💡 推荐理由: 保护DNN模型知识产权是AI安全的核心问题,该工作针对DNN二进制特有的逆向攻击提出专用防御,填补了通用混淆方案的空白。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
推荐 9.6
Conf: 50%
👥 作者: Nico Schiller, Merlin Chlosta, Moritz Schloegel, Nils Bars, Thorsten Eisenhofer, Tobias Scharnowski, Felix Domke, Lea Schönherr, Thorsten Holz

本文对 DJI 无人机中 DroneID 系统的安全性进行了深入分析。DroneID 是 DJI 自 2019 年起强制在其消费级和专业级无人机中集成的远程身份识别和广播系统,用于向监管机构和公众广播无人机的位置、高度、速度等信息。研究者通过逆向工程、固件分析、硬件调试和无线电信号解码等手段,系统性地检查了 DroneID 的实现。他们发现 DroneID 使用了自创的、非标准的协议,其中包含了多个严重安全漏洞:首先,DroneID 数据包未加密传输,任何具备 SDR 设备的观察者都能截获并解析无人机身份和位置信息;其次,DroneID 身份标识可以轻易伪造,攻击者可以冒充合法无人机发送虚假位置信息,或隐藏真实无人机;第三,协议缺乏完整性校验,允许攻击者篡改正在广播的数据;最后,研究者还发现了硬件层面的调试接口泄漏,可提取加密密钥。这些漏洞组合起来可能导致无人机被远程劫持、隐私大规模泄露、监管数据不可信等严重后果。作者在负责任披露后,DJI 部分承认问题并在后续固件中尝试缓解,但核心协议缺陷依然存在。本文适合无人机安全研究者、物联网安全从业者及监管机构阅读。

💡 推荐理由: DroneID 是无人机监管和空中交通管理的基石,其安全缺陷直接威胁公共安全和隐私,影响数百万 DJI 用户和监管体系的可信度。

🎯 建议动作: 跟踪厂商修复进展,评估自身无人机部署是否受影响;若使用 DJI 无人机,尽快升级固件至最新版本并关注官方安全公告。

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.6)
👥 作者: Monika Santra

该论文提出了一种新颖的 AI 增强静态分析方法,旨在弥合传统静态分析中启发式方法与完备性之间的鸿沟,为实用的逆向工程提供可靠解决方案。逆向工程面临诸多挑战,如代码与数据交织、缺少名称/类型/栈帧、编译器激进优化以及各种混淆技术。传统静态分析工具依赖基于启发式的策略,但易受特定模式限制且泛化能力不足。近年来,AI 技术在从低级表示中预测高级语义结构方面展现出潜力,例如通过深度学习模型推断丢失的编译时信息。然而,纯 AI 方法在安全关键的二进制分析中往往难以保证完备性和可靠性。为此,论文提出了 AI 与静态分析的协同框架:用 AI 替代脆弱的启发式规则以增强泛化能力,同时利用静态分析提供的最佳努力完备性来强化 AI,满足安全应用的严格要求。研究聚焦于三个在学术研究和现有工具中服务不足的关键逆向工程任务:指令边界识别、函数边界识别以及控制流图(CFG)的构建,特别是针对间接调用目标的解析。最终目标是开发一个端到端的反汇编框架,实现 AI 与静态分析的深度融合。实验部分预期将展示该方法在准确性和完整性上优于现有纯静态或纯 AI 方案。该工作适合二进制安全分析师、逆向工程师以及编译器/静态分析工具开发者阅读。

💡 推荐理由: 该研究直接解决逆向工程中长期的瓶颈问题——如何在保证完备性的前提下提升自动化程度。对于安全分析人员而言,更可靠的指令/函数边界识别和 CFG 构建能显著减少误报漏报,提高恶意软件分析、漏洞挖掘等任务的效率。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Brian Crawford, Patrick McClure

该论文研究了面向软件逆向工程的多智能体系统在分析二进制可执行文件时面临的提示注入攻击威胁。攻击者可将恶意注入字符串嵌入源代码或编译产物中,当AI代理解析反编译输出时触发异常行为。作者首先展示了如何利用现有反编译器检测被篡改后的可执行文件中的注入字符串,并系统评估了多种检测方法的有效性,包括基于正则表达式、特征签名以及机器学习分类器的方案。随后,论文重点探索了攻击者可能采用的混淆技术,如代码流平坦化、指令替换、字符串加密等,使注入内容更难被静态分析捕获。针对这些混淆手段,作者又提出了相应的防御策略,包括动态污点追踪、语义哈希过滤以及上下文感知的提示清理机制。实验基于一组公开的恶意软件样本和人工构造的对抗样本进行,结果表明:在无混淆场景下,基于上下文的检测器可达到95%以上的召回率;面对中等强度的混淆,综合使用静态与动态检测能将准确率维持在85%左右;而高度混淆的对抗样本仍能绕过部分检测,形成约10-20%的漏报率。论文最终指出,当前技术尚无法完全消除此类攻击风险,但通过多阶段检测与输入规范化,可大幅降低实际运营中的威胁。该工作对将AI代理部署到生产环境的逆向工程平台、安全分析流水线及漏洞挖掘系统具有直接指导意义。

💡 推荐理由: AI代理辅助逆向工程正逐步进入企业端安全运营流程,但提示注入攻击可导致代理给出错误结论甚至执行恶意动作。本文首次系统揭示了该场景下的攻击链与防御基线,为蓝队评估自身AI系统的健壮性提供了具体参考。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
推荐 5.5
Conf: 50%
👥 作者: Brian Crawford, Justin Phillips, Patrick McClure

该论文研究了针对大型语言模型(LLM)驱动的逆向工程 AI 代理的自动化攻击方法。随着 LLM 被集成到如 Ghidra 等二进制逆向工程工具中,自动化分析流程得以实现,但同时也引入了新的安全风险。作者提出了一种基于遗传算法的提示生成技术(AutoDAN 的变种),用于欺骗 LLM 驱动的反汇编和反编译系统,使其错误理解二进制可执行文件,从而破坏分析输出。该方法利用 LLM 在处理反编译代码时对提示注入的脆弱性,通过在二进制文件中插入不影响功能的额外字符串变量赋值,向 LLM 传递隐蔽指令。实验通过多个简洁示例展示了该攻击的有效性,证明攻击者能够绕过依赖 LLM 分析的自动化检测系统。该研究揭示了将 LLM 集成到网络安全工具链中的安全隐患,并为构建更稳健的自主代码分析系统提供了见解。适合安全研究人员、LLM 安全工程师及逆向工程工具开发者阅读。

💡 推荐理由: 该论文首次系统性地提出针对 LLM 逆向工程代理的自动化对抗攻击,揭示了 AI 驱动安全工具的新脆弱面,对依赖 LLM 进行恶意软件分析的安全运营团队具有重要警示意义。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Shijia Li, Chunfu Jia, Pengda Qiu, Qiyuan Chen 0006, Jiang Ming 0002, Debin Gao

该论文针对商业代码虚拟化混淆器(如Themida、VMProtect)提出了一种名为“选定指令攻击”(Chosen-Instruction Attack)的新方法。代码虚拟化是一种高级混淆技术,通过自定义虚拟机(VM)模拟原始指令的语义,使得逆向工程极其困难。恶意软件开发者常滥用此类商业混淆器隐藏恶意行为。由于商业混淆器的内部机制是黑盒,分析人员需要在大规模高度混淆的程序上进行逆向工程,成本高且不精确。论文的核心思想是:攻击者可以主动选择并输入特定指令,观察混淆器对这些指令的翻译输出,从而推断虚拟机内部的操作码、执行逻辑等关键信息。该方法不需要对混淆器进行静态逆向,而是通过动态多对一的指令映射分析,逐步恢复原始程序的语义。实验结果表明,该攻击能够有效针对多个商业混淆器,显著降低反混淆的复杂度和时间开销。论文的主要贡献包括:揭示了商业混淆器的可攻击性,提出了一种实用的黑盒分析方法,并提供了评估基准。适合逆向工程、恶意软件分析和软件安全领域的研究人员与从业者阅读。

💡 推荐理由: 揭示了商业代码虚拟化混淆器可能存在的安全弱点,为恶意软件分析人员提供了新的反混淆思路,有助于提升对受保护恶意样本的逆向效率。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Yannik Dittmar, Marvin Jerome Stephan, Thomas Völkl, Matthias Hollick, Jiska Classen

该论文首次对苹果的私有云计算(Private Cloud Compute, PCC)系统进行了逆向工程分析,旨在评估其隐私保护声明的可信度。PCC是苹果为在移动设备上集成AI而设计的隐私优先计算架构,其核心宣称包括不存储用户数据、用户输入与账户不可关联。尽管苹果公开了大部分系统规范,但编译后的二进制文件缺乏符号、不可重现构建,导致规范与实际部署之间存在潜在差异。此外,底层模型和查询接口未公开,限制了学术评估。研究者通过逆向工程移动设备上的PCC实现,成功打开了非公开接口,允许在本地设备上执行自定义PCC查询,并独立对PCC模型进行了基准测试。他们发现当前实现中存在一些与隐私承诺的偏差,例如某些日志行为可能暴露用户交互信息。该研究还公开了PCC基准测试框架,为后续隐私评估提供了工具。主要贡献包括:首次详细的PCC逆向工程、开放非公开接口、独立模型性能评估以及公开测试框架。适合关注移动AI隐私、苹果安全架构以及云隐私方案验证的研究人员和安全从业者阅读。

💡 推荐理由: 评估苹果PCC隐私承诺的真实性,发现闭源二进制与规范间的差距,为验证隐私保护AI系统提供方法。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Alexander Shypula, Osbert Bastani, Edward Schwartz

反编译器是逆向工程中用于从编译后的二进制代码重构源代码的重要工具。然而,由于编译器在将人类可读的代码转换为低级机器码时,会丢失高级语法、标识符和自定义数据类型等信息,因此从编译后的二进制代码中重构源代码是一项具有挑战性的任务。传统的确定性反编译器虽然实用,但在推断惯用语法和标识符名称方面存在困难。生成式AI模型天然适合重构高级语法、标识符和类型,但可能会产生幻觉,生成不正确的编程结构和语义。本文提出了Decaf(DECompilation with Automated Feedback,自动反馈反编译)系统,其核心思想是:不是通过更多数据和更多训练来改进神经反编译器,而是利用编译器反馈通过搜索来大幅提升神经反编译器输出的语义正确性。具体地,Decaf在反编译器生成多个候选代码后,使用编译器对候选代码进行编译并检查是否与原始二进制代码在语义上等价(例如通过比较执行结果或二进制相似性),从而筛选出最符合语义的候选。实验基于ExeBench数据集,在Real -O2优化级别上,Decaf将神经反编译的成功率从26.0%提升至83.9%,且不牺牲与原始源代码的相似性。此外,该自动反馈方法对于较弱的神经反编译模型同样非常有效。该研究为机器学习驱动的反编译提供了新范式,证明了结合编译器反馈和搜索可以显著改善反编译质量,对于逆向工程、恶意软件分析、遗留代码理解等领域具有重要价值。

💡 推荐理由: 该研究通过编译器反馈与搜索机制,显著提升了神经反编译器的语义正确性,解决了传统方法依赖大量训练数据且容易产生幻觉的痛点,为逆向工程、恶意软件分析和二进制漏洞研究提供了更可靠的自动化工具。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Sangjun An, Hyeyeon Park, Yejin Son, Seoksu Lee, Eun-Sun Cho

该论文针对虚拟化混淆(virtualization-based obfuscation)产生的二进制代码分析难题,提出了一种基于大语言模型(LLM)的结构化分析方法。虚拟化混淆会将原始代码转换为极其庞大且结构复杂的中间表示,导致传统LLM因输入长度限制和缺乏大规模标注数据而难以直接处理。研究者将问题聚焦于结构分析而非完整的语义理解,通过将混淆后的二进制文件分解为最大的语义连贯单元(即片段),使其符合LLM的上下文窗口限制,并依据这些片段在混淆结构中的角色(如虚拟机入口、解释器循环、操作码处理等)进行自动标注。他们实现了一个静态分析框架,能够自动完成碎片化、标注和数据集生成,从而无需人工标注即可构建大规模训练数据。实验使用多个真实世界的虚拟化混淆器(例如基于虚拟机架构的混淆工具)进行测试,结果表明该框架生成的片段在LLM分析中表现出较高的准确性和覆盖度,能够有效识别混淆代码的结构特征。该工作为LLM在恶意软件分析、逆向工程等场景中处理高度混淆代码提供了可行的数据生成和分析范式。

💡 推荐理由: 虚拟化混淆是高级恶意软件和版权保护常用的对抗技术,传统静态分析工具难以应对。该论文首次提出通过LLM进行结构化分析,并解决了数据生成瓶颈,有望大幅提升安全分析师对混淆代码的逆向效率。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Zion Leonahenahe Basque, Samuele Doria, Ananta Soneji, Wil Gibbs, Adam Doupé, Yan Shoshitaishvili, Eleonora Losiouk, Ruoyu Wang 0001, Simone Aonzo

本文针对软件逆向工程(RE)领域,提出了一个全新的研究视角:人类专家与大型语言模型(LLM)协同工作的有效性。尽管LLM在代码理解和生成方面展现出潜力,但在复杂的逆向工程任务中,人类直觉与机器自动化的结合尚未被系统研究。本研究设计了一系列实验,邀请具有不同经验水平的逆向工程师参与,要求他们在使用LLM辅助(如GPT-4)和传统工具两种条件下完成二进制逆向任务。通过量化分析任务完成时间、准确率、认知负荷以及用户反馈,作者揭示了人机协作中的关键挑战与机遇:LLM可以加速模式识别和代码注释生成,但在处理高度混淆或架构特定细节时容易出错,需要人类进行验证和修正。实验表明,有效的协同需要工程师具备足够的领域知识以批判性地评估LLM输出,而LLM则需提供可解释的推理过程。该研究还提出了一个初步的协作框架,指导如何设计更好的LLM辅助逆向工具。

💡 推荐理由: 随着LLM在安全领域的广泛应用,理解人机协作在逆向工程中的实际效果至关重要。本研究为开发更有效的自动化逆向辅助工具提供了实证基础,帮助安全分析师提升效率并减少盲点。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Jun Yeon Won, Xin Jin, Shiqing Ma, Zhiqiang Lin

该论文提出了 REBENCH,一个用于评估大型语言模型(LLM)在二进制逆向工程任务中性能的标准化基准数据集。当前,LLM 在计算机安全领域,尤其是逆向工程中的函数名恢复、变量名恢复和类型推断等任务上取得了显著进展。然而,由于缺乏标准化的数据集,不同研究使用不同的数据集、预处理流程和评估指标,导致结果难以公平比较,也阻碍了对 LLM 在二进制分析中能力的清晰认识。REBENCH 旨在解决这一问题,它整合了现有多个数据集的超集,包含数亿行源代码以及跨多种架构(如 x86、ARM)和优化级别的多样化二进制文件。该方法基于知识库驱动,通过存储字节级堆栈信息来生成真实标签(ground truth),从而在保持任务难度的同时确保通用适用性。这种设计避免了可能引入偏见的简化,使得跨不同任务的评估更加公平。作为用例,作者使用 REBENCH 测量了多个 LLM 在逆向工程任务上的表现,结果显示在复杂任务上仍存在困难。该基准为研究人员提供了一个统一、可复现的评估平台,有助于推动 LLM 在二进制分析领域的进步。

💡 推荐理由: REBENCH 填补了 LLM 在二进制逆向工程评估中缺乏标准化基准的空白,使得不同方法之间可以公平比较,有助于社区准确理解当前 LLM 的能力边界和瓶颈。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)