#smart-contract

共收录 14 条相关安全情报。

← 返回所有主题
推荐 9.5
Conf: 50%
👥 作者: Samuel Steffen, Benjamin Bichsel, Martin T. Vechev

本文提出Zapper,一个旨在为智能合约提供数据和身份隐私保护的系统。在区块链环境中,智能合约的执行数据通常对所有节点公开,这导致敏感信息(如交易金额、用户身份)面临泄露风险。Zapper通过集成先进的密码学技术(如零知识证明、同态加密或安全多方计算),实现合约状态的加密存储与计算,同时允许验证者在不泄露具体数据的情况下确认合约的正确执行。此外,Zapper还支持匿名认证机制,隐藏交易参与方的身份,从而增强用户隐私。该工作可能设计了一套新的编程模型或编译器,使开发者能够便捷地编写隐私保护智能合约,并在以太坊等平台上部署。实验评估可能展示了其在计算开销、交易成本和可扩展性方面的权衡。该研究对区块链隐私保护领域具有重要参考价值,尤其适用于金融、供应链和身份管理等对隐私敏感的应用场景。

💡 推荐理由: 智能合约的透明性虽是优势却也带来隐私风险,Zapper直接解决这一矛盾,为合规要求(如GDPR)下的区块链应用提供技术基础,值得安全从业者关注。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Xiaoting Zhang, Zhipeng Gao, Yiran Lv, Xing Hu, Feifei Niu, Xin Xia

该论文提出了 GiANT 自动化框架,旨在解决智能合约审计数据集构建中的人工可扩展性瓶颈以及数据粒度和多样性不足的问题。GiANT 采用分治策略结合思维链技术,从 Code4rena 平台上的真实审计报告中提取结构化漏洞信息,并通过 LLM 作为裁判机制进行严格的质量保证。研究者在 388 份真实审计报告上运行 GiANT,生成了包含 7,711 个漏洞发现、覆盖五个严重级别的 GiAnt Corpus 数据集。手动评估显示信息提取可靠性极高,平均质量得分 4.76/5,评分者间一致性 κ=0.88。进一步,他们使用该数据集对四个最先进的 LLM 在漏洞检测、代码摘要、缓解建议和自动 Gas 优化任务上进行基准测试,建立了性能基线,为自动化智能合约审计的未来研究提供了宝贵的数据基础。

💡 推荐理由: 该工作提供了一个高质量、大规模、多粒度的智能合约审计数据集,有助于推动自动化审计工具和大型语言模型在区块链安全领域的研究与评估。

🎯 建议动作: 研究跟进,考虑将该数据集纳入智能合约安全工具的评估基准。

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Gabriela Dobrita, Simona-Vasilica Oprea, Adela Bara

现有的基于学习的Solidity智能合约漏洞检测器通常将检测简化为单函数内的语法模式匹配,但许多重大利用(如The DAO、Cream Finance)并不存在于单个函数中,而是存在于函数间的关系以及使攻击可行的条件组合之中。为此,本文提出AttackPathGNN,一种将检测重新定义为对显式攻击路径推理的图神经网络(GNN)。其两个架构创新区别于先前的GNN检测器:(1)状态干扰图(State Interference Graph),该图通过带类型和权重的边以及由显式五条件谓词定义的有向重入路径边,连接共享可变存储的每对函数;(2)合取池化(conjunction pooling),一种对八个命名利用前提条件的可微AND聚合器,其log-sigmoid形式使得当任一缓解措施(如重入守卫、访问控制修饰符或SafeMath)到位时,每个函数的利用评分会骤降。在五个独立训练运行中,AttackPathGNN在SmartBugs Wild保留测试集上达到92.3±0.2%的F1分数(假阴性率4.3±0.3%,在独立人工标注的SmartBugs Curated基准上检测率90.8±2.5%),并在每个种子上以100%恢复6/10个DASP10类别,重入检测达到98.7±1.8%。每次预测都附带结构化的修复报告,将每个判定转化为可操作的、函数级别的审计发现。该研究对智能合约安全审计、自动化漏洞检测工具开发具有重要参考价值。

💡 推荐理由: 该研究创新性地将漏洞检测从单函数模式匹配提升到跨函数攻击路径推理,显著降低了假阴性率,并提供了可解释的修复建议,对提升智能合约审计的自动化水平和准确率有实际价值。

🎯 建议动作: 研究跟进并考虑将方法集成到内部智能合约审计流程中。

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
推荐 9.4
Conf: 50%
👥 作者: Tommaso Frassetto, Patrick Jauernig, David Koisser, David Kretzler, Benjamin Schlosser, Sebastian Faust, Ahmad-Reza Sadeghi

本文提出了一种名为POSE(Practical Off-chain Smart Contract Execution)的实用链下智能合约执行协议。当前,以太坊等区块链平台的智能合约执行成本高昂,尤其是Gas费用飙升,使得复杂应用难以部署。现有的链下解决方案存在区块链交互成本高、数据隐私缺乏、质押资本大量锁定或仅支持有限应用等缺陷。POSE通过利用可信执行环境(TEE)池来高效执行计算,并能快速从意外或恶意故障中恢复。该协议在大量参与者被攻陷的情况下仍能提供强安全保证。作者实现了概念验证系统,并评估了其效率和有效性。该工作主要面向区块链、智能合约及可信计算领域的研究人员和开发者。

💡 推荐理由: 该研究提出了一种结合TEE的实用链下智能合约执行方案,有望显著降低Gas费用并提升隐私性,为区块链可扩展性问题提供了新思路。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.4)
👥 作者: Wan-Hsuan Hsu, Wei-Hsin Wang, Cheng-Yu Liou, Ting-Rui Ke, Kentaroh Toyoda

该论文提出了Bastet,一个面向去中心化金融(DeFi)智能合约漏洞检测的细粒度专家标注数据集。2024年,DeFi协议因智能合约漏洞累计损失超过14.9亿美元,基于大语言模型(LLM)的漏洞检测成为有前景的应对方案,但现有评估数据集存在三大问题:基于过时的Solidity版本(如v0.4),无法反映现代DeFi合约;依赖自动化或LLM生成的标注,引入幻觉导致的标签噪声;采用粗粒度的单层标签,难以捕获真实业务逻辑漏洞的语义复杂性。Bastet通过以下方式解决这些问题:数据来源为2021-2024年的真实审计发现;由人类专家通过讨论达成共识进行标注;采用两层分类体系,包含46个标签和77个子标签。数据集包含从394份Code4rena竞争性审计报告中收集的4,402个发现(时间跨度为2021年4月至2024年11月),其中849个发现由DeFiHackLabs社区的白帽安全研究人员完全标注。所有标注均通过双标注者共识工作流程生成,确保了基于真实漏洞根因的标签准确性。该数据集的主要贡献在于:提供高质量、精细化的基准,以推动LLM在DeFi安全领域的应用研究,并促进可复现的实验评估。适合智能合约安全研究人员、LLM应用开发者及DeFi协议审计人员阅读。

💡 推荐理由: 现有漏洞检测数据集质量低下,限制了LLM模型的实际效果。Bastet通过专家标注和精细分类,为DeFi智能合约漏洞检测提供了可靠基准,有望显著提升自动化审计的准确性和实用性。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Christoph Sendner, Huili Chen, Hossein Fereidooni, Lukas Petzi, Jan König, Jasper Stang, Alexandra Dmitrienko, Ahmad-Reza Sadeghi, Farinaz Koushanfar

本文提出了一种名为ESCORT的深度学习框架,用于检测以太坊智能合约中的多种漏洞类型。传统检测方法通常只针对单一或少数漏洞类型,且扩展到新类型时需要大量重新设计。ESCORT采用通用特征提取器学习合约字节码的通用语义,并针对每种漏洞类型设置独立分支,实现多标签分类,可同时检测多个漏洞。更重要的是,ESCORT利用迁移学习,当出现新的漏洞类型时,只需在预训练的特征提取器上添加新分支,并用少量数据微调即可,避免了重新训练整个模型的开销。实验基于361万个真实智能合约数据集,初始阶段在六种漏洞类型(如重入、时间戳依赖等)上平均F1分数达98%;迁移学习阶段对另外五种新漏洞类型平均F1分数达96%。与现有非机器学习工具相比,ESCORT可处理任意复杂度的合约,实现100%合约覆盖,并支持多漏洞并发检测,显著缩短检测时间。该研究是首个将迁移学习应用于智能合约漏洞检测的深度学习框架,并将开源数据集和标注工具链以促进后续研究。

💡 推荐理由: 智能合约漏洞已导致数十亿美元损失,现有检测工具扩展性差。ESCORT的迁移学习方法使得快速适配新型漏洞成为可能,对区块链安全防御具有重要实践价值。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Bagus Rakadyanto Oktavianto Putra, Muhamad Risqi Utama Saputra, Widyawan, Guntur Dharma Putra

该论文提出了一种轻量级的智能合约安全审计框架,利用经过蒸馏和聚合的开放源码大语言模型(LLM)来应对现有基于LLM的审计方法存在的计算开销大、缺乏严重性评估以及可操作修复建议等问题。框架将审计任务解耦为四个独立模块:漏洞检测、漏洞解释、严重性分类和修复建议。通过采用秩稳定低秩适配器(rsLoRA)、知识蒸馏以及定制的链式验证(CoVe)聚合策略,模型在保持高精度的同时显著降低了参数量(0.6B-4B参数)。实验表明,该轻量级流水线在漏洞检测上达到98.25%的准确率,在生成解释任务中对齐得分为0.4375,优于参数量7B-34B的密集编码器LLM。消融实验验证了解耦审计流程相比统一提示的优势,并发现了新颖的严重性中心偏差,为未来LLM辅助审计研究建立了基准。

💡 推荐理由: 该研究展示了如何利用轻量级模型在不牺牲性能的情况下实现高效的智能合约审计,为资源受限的团队提供了可行的自动化安全审计方案。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
推荐 3.5
Conf: 50%
👥 作者: Ahto Buldas, Dirk Draheim, Mike Gault, Risto Laanoja, Vladimir Rogojin, Ahto Truu

该论文提出了一种名为 Unicity 的代币所有权模型的泛化版本,将传统简单的所有权条件扩展为可编程的支出条件,称为“谓词”(predicates)。这些谓词允许在链下执行类似智能合约的功能,而无需共识参与者(如矿工或验证者)直接执行,而是由依赖方(如交易接收者)自行验证。作者证明,Unicity 执行层的安全属性可以归约到谓词族不可伪造性(predicate family unforgeability),从而保证了在添加可编程条件后,系统的安全基础不受损害。为了展示该模型的实用性,论文详细描述了如何利用谓词实现无信任的原子交换(atomic swap),即两个互不信任的参与方在不依赖第三方中介的情况下安全交换代币。原子交换的实现通过构建特定的谓词条件,使得交易要么全部执行,要么全部回滚,避免了部分执行的风险。该研究为区块链和去中心化金融领域提供了一种新的链下智能合约范式,降低了链上计算和存储开销,同时保留了安全保证。

💡 推荐理由: 该研究提出了一种链下可编程支出条件的安全模型,为去中心化金融中的原子交换等场景提供了更高效、无需信任的解决方案。安全从业者应关注其归约证明方法,以确保类似系统的安全性分析。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Ray Iskander

本文提出了首个经过机器检查的OpenZeppelin重入防护模式正确性证明,该证明针对生产部署的Solidity源代码的Lean 4状态机模型。所有十三个定理都经过了机器检查,没有使用任何“sorry”或用户引入的公理,公理足迹仅由[propext](一个标准的mathlib4公理)限定,并集成在持续集成中。智能合约重入攻击自2016年以来已导致超过5亿美元的损失,其中DAO 2016攻击盗取了约360万ETH,并迫使以太坊硬分叉。OpenZeppelin ReentrancyGuard模式是生产DeFi中的事实标准防御措施,但此前没有工作建立其判别能力:即该防护能阻止对易受攻击实例的攻击,保持非攻击交易的正确执行,并区分相邻的安全和易受攻击变体。以往的工作要么形式化了玩具合约上的防护正确性,要么形式化了孤立实例上的攻击可行性,但未同时涵盖两个方向及针对生产源码的边界情况。本文通过变异测试验证了三种生产实例:DAO 2016、Compound v2和Aave V3的flashLoan,以及Aave V3 flashLoan的一个最小差异突变体(flashLoanVulnerable),该突变体隔离了一个安全关键差异。三方向结构包括:(a) DAO 2016模式的攻击复现,(b) Compound v2的正确性证明,(c) 区分Aave V3符合CEI模式的flashLoan与突变体的边界案例证明。一个顶层的元定理在“无改造”原则下组合了这三个方向,并在首次跨协议压力测试(从Compound v2到Aave V3)中进行了演示;更广泛的家族可移植性是未来工作。完整的Lean 4源码、CI配置和复现命令可在GitHub上获取。

💡 推荐理由: 首次对生产级DeFi合约的重入防护进行机器检查的形式化验证,提供了高可靠性的安全保证,为智能合约安全审计和形式化验证方法学树立了新标杆。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
推荐 5.5
Conf: 50%
👥 作者: Kaihua Qin, Dawn Song, Arthur Gervais

智能合约反编译旨在从字节码恢复高级语言源代码,但现有评估方法存在数据集狭窄、指标不一致、语义一致性检查有限等问题。随着大型语言模型(LLMs)开始生成看似合理但语义可能偏离原始合约的Solidity代码,这一问题变得日益重要。本文提出SCDBench,一个基于LLM的智能合约反编译器数据集和评估基准。数据集包含600个真实Solidity合约,配有其字节码输入、真实源代码和可重放的语义检查点。SCDBench通过四个递进阶段评估反编译输出:格式完整性、可编译性、应用程序二进制接口(ABI)恢复以及通过差分重放实现语义一致性。作者在零样本反编译设置下评估了Claude Opus 4.7、GPT-5.3-Codex和GLM-5(包括有无扩展推理的变体)以及零样本编译修复设置。结果表明,前沿LLM通常能生成结构清晰且可编译的Solidity代码,但实现语义一致性仍远未解决:最佳模型仅完美反编译42/600个合约。进一步实验表明,引入同模型编译修复以适度成本显著提升了性能。SCDBench为严格且可重复的评估建立了共同基础,旨在加速开发用于区块链安全与透明性的可靠智能合约反编译器。

💡 推荐理由: 该研究为评估LLM在智能合约反编译任务中的表现提供了标准化基准,填补了现有评估方法的空白,对区块链安全审计、漏洞检测和合约分析具有重要参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Qiyang Song, Heqing Huang 0001, Xiaoqi Jia, Yuanbo Xie, Jiahao Cao 0001

以太坊智能合约的重入漏洞曾导致重大经济损失,为此社区开发了多种自动化重入检测器。然而,这些检测器由于检测规则粗糙,频繁产生大量误报,常将受抗重入模式保护的合约误判为存在漏洞。因此,迫切需要开发专门的自动化工具来辅助检测器准确识别抗重入模式。现有代码分析技术虽在特定任务上有潜力,但在识别抗重入模式时仍面临挑战,主要因为抗重入模式的特征复杂多样,且缺乏对这些特征的先验知识。本文提出 AutoAR,一种自动化识别系统,用于探索和识别以太坊合约中常见的抗重入模式。AutoAR 利用专门的图表示 RentPDG,结合数据过滤方法,从大量合约中有效捕获与抗重入相关的语义。基于提取的 RentPDG,AutoAR 采用集成图自编码器和聚类技术的识别模型,专门用于精确识别抗重入模式。实验结果表明,AutoAR 能以 89% 的准确率辅助现有检测器识别 12 种常见抗重入模式;集成到检测流程后,误报率降低超过 85%。该工作为智能合约安全分析提供了新的思路,有望提升重入漏洞检测的精度,减少人工审计负担。

💡 推荐理由: 以太坊智能合约重入检测误报率高是实际痛点,该工作通过自动识别抗重入模式显著降低误报,对提升自动化安全工具实用性至关重要。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Stefan-Claudiu Susan, Andrei Arusoaie, Dorel Lucanu

该论文针对基于大型语言模型(LLM)的静态分析在智能合约安全开发中的可靠性和局限性进行了系统基准测试。研究背景是区块链交易的不可逆性使得智能合约漏洞检测成为安全开发的必备环节,而LLM虽被越来越多地集成到开发者工作流中,其作为自主安全审计工具的可靠性尚未得到证实。研究者评估了当前生成模型能否替代传统的静态分析工具,或仅作为其补充。实验发现,LLM的效果受到词汇偏差和缺乏外部数据输入严格验证的削弱,这种对非语义启发式(如标识符命名)的依赖导致高误报率。此外,不同的提示技术在精确率和召回率之间呈现权衡。研究结果基于自定自动化框架得出,该框架在分类模型输出时达到了92%的准确率。论文核心贡献在于量化了LLM在智能合约漏洞检测中的局限性,并提出混合解决方案的可能性。适合安全研究人员、智能合约开发者以及LLM应用开发者阅读。

💡 推荐理由: 揭示了LLM作为智能合约安全审计工具的固有短板,提醒安全从业者不能盲目依赖LLM检测结果,需结合传统静态分析或人工审查。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Xing Zhang, Keyu Zhang, Taohong Zhu, Anbang Ruan

本文提出了一种基于大语言模型(LLM)的智能合约漏洞检测框架。智能合约因其不可篡改特性,易遭受多种安全漏洞攻击,导致重大经济损失。现有检测方法通常依赖人工制定的专家规则,缺乏对不同漏洞类型的灵活适应性。为此,作者构建并公开了一个大规模数据集,包含来自15个主流区块链平台、超过3200个真实项目的31165个专业标注的漏洞实例。该框架利用基于抽象语法树(AST)的精确上下文提取和漏洞特定的提示设计,为13种常见漏洞类型实例化定制检测器。实验结果表明,该方法平均正样本召回率达0.92,平均负样本召回率达0.85,展示了精心设计的上下文提示在实现可扩展、高精度智能合约安全分析方面的潜力。该研究为智能合约安全检测提供了新的思路,特别适合安全研究人员和区块链开发者关注。

💡 推荐理由: 智能合约漏洞频发导致巨额损失,现有检测方法缺乏灵活性。本文利用LLM和大规模数据集实现高召回率检测,有望提升智能合约安全分析的自动化和准确性。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Zijun Feng, Yuming Feng, Yu Wang, Weizhe Zhang, Yuhong Nan, Yuang Liu, Zibin Zheng

本文提出 GoAT-X 框架,旨在解决跨链桥合约安全审计中的语义复杂性问题。跨链桥作为多链生态的关键基础设施,因实现缺陷已造成超过28亿美元损失。现有防御手段如字节码级静态分析难以处理跨链交互的语义复杂度,而基于大语言模型(LLM)的方法虽能理解源代码,但在复杂多合约依赖上容易出现幻觉推理。GoAT-X 将审计过程建模为“审计思维图”(Graph of Auditing Thoughts),模仿人类专家分解、推理和验证安全逻辑的方式。通过将LLM推理锚定在静态提取的数据流上,并将抽象安全属性显式链接到具体代码实现,该框架将语义约束在良定义的结构和状态边界内。在此受限空间中,GoAT-X 将跨链逻辑中的缺失约束和对抗绕过路径作为首要漏洞目标,动态探索推理路径以识别可被利用的语义鸿沟。在涵盖所有已知跨链代币交易攻击的综合基准测试中,GoAT-X 在细粒度审计点上达到92%的召回率,对存在漏洞的项目覆盖率达95%,并在实际场景中识别出117个经确认的风险,且运营成本较低,为可扩展的、逻辑驱动的跨链安全审计建立了新标准。

💡 推荐理由: 跨链桥安全漏洞导致巨额损失,现有自动化审计工具难以应对语义复杂性。GoAT-X首次将LLM推理与静态分析结合,通过结构化思维图实现精准审计,为安全团队提供可落地的规模化审计方案,显著降低漏报。

🎯 建议动作: 研究跟进

排序因子: 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)