#auditing

共收录 7 条相关安全情报。

← 返回所有主题
👥 作者: Xiaoting Zhang, Zhipeng Gao, Yiran Lv, Xing Hu, Feifei Niu, Xin Xia

该论文提出了 GiANT 自动化框架,旨在解决智能合约审计数据集构建中的人工可扩展性瓶颈以及数据粒度和多样性不足的问题。GiANT 采用分治策略结合思维链技术,从 Code4rena 平台上的真实审计报告中提取结构化漏洞信息,并通过 LLM 作为裁判机制进行严格的质量保证。研究者在 388 份真实审计报告上运行 GiANT,生成了包含 7,711 个漏洞发现、覆盖五个严重级别的 GiAnt Corpus 数据集。手动评估显示信息提取可靠性极高,平均质量得分 4.76/5,评分者间一致性 κ=0.88。进一步,他们使用该数据集对四个最先进的 LLM 在漏洞检测、代码摘要、缓解建议和自动 Gas 优化任务上进行基准测试,建立了性能基线,为自动化智能合约审计的未来研究提供了宝贵的数据基础。

💡 推荐理由: 该工作提供了一个高质量、大规模、多粒度的智能合约审计数据集,有助于推动自动化审计工具和大型语言模型在区块链安全领域的研究与评估。

🎯 建议动作: 研究跟进,考虑将该数据集纳入智能合约安全工具的评估基准。

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Bagus Rakadyanto Oktavianto Putra, Muhamad Risqi Utama Saputra, Widyawan, Guntur Dharma Putra

该论文提出了一种轻量级的智能合约安全审计框架,利用经过蒸馏和聚合的开放源码大语言模型(LLM)来应对现有基于LLM的审计方法存在的计算开销大、缺乏严重性评估以及可操作修复建议等问题。框架将审计任务解耦为四个独立模块:漏洞检测、漏洞解释、严重性分类和修复建议。通过采用秩稳定低秩适配器(rsLoRA)、知识蒸馏以及定制的链式验证(CoVe)聚合策略,模型在保持高精度的同时显著降低了参数量(0.6B-4B参数)。实验表明,该轻量级流水线在漏洞检测上达到98.25%的准确率,在生成解释任务中对齐得分为0.4375,优于参数量7B-34B的密集编码器LLM。消融实验验证了解耦审计流程相比统一提示的优势,并发现了新颖的严重性中心偏差,为未来LLM辅助审计研究建立了基准。

💡 推荐理由: 该研究展示了如何利用轻量级模型在不牺牲性能的情况下实现高效的智能合约审计,为资源受限的团队提供了可行的自动化安全审计方案。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Shahinul Hoque, Jinghuai Zhang, Jinyuan Sun, Fnu Suya

本文研究了大型语言模型(LLM)商业服务中按token计费模式下的审计漏洞。当前主流计费方式是基于token数量收费,但服务提供商出于保护知识产权、防御越狱攻击和用户隐私等理由,隐藏了模型、分词器及执行细节,使得用户难以独立验证计费token的真实性。作者将这种审计困境定义为“信任悖论”:任何审计都必须信任提供商提供的某些证据,而这些证据恰恰是提供商最有动机篡改的部分。论文系统分析了三种现有的token审计框架,并证明具备普通商业能力(如典型API提供商)的攻击者可以系统地夸大计费token数。在最宽松的设置下(用户无法看到推理过程),隐藏推理阶段的token使用量平均可被夸大1469%,将原本100美元的账单变成约1569美元。即使允许用户查看完整推理字符串,仅利用分词歧义性仍可在检测阈值以下实现50.85%的超报。研究表明,问题不在于某个具体的审计器,而在于所有依赖被审计方提供证据的审计方案。恢复诚实计费需要将报告token与提供商无法控制的证据绑定,例如可信执行认证、加密推理证明或第三方重执行。本文对云安全、LLM服务计费透明度以及可审计性领域具有重要研究价值,适合安全审计研究者、云服务提供商及依赖LLM API的企业关注。

💡 推荐理由: 揭示LLM计费中普遍存在的信任悖论:即使有审计框架,提供商仍可轻易夸大token用量,导致用户财务损失。这直接威胁到以按量计费为商业模式的AI服务的可信性,是安全从业者必须警惕的新型经济型攻击面。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Önder Askin, Holger Dette, Martin Dunsche, Tim Kutta, Yun Lu 0001, Yu Wei 0007, Vassilis Zikas

本文研究差分隐私(DP)的精细变体——f-差分隐私(f-DP)的统计评估与审计方法。f-DP通过一个函数f描述隐私损失,相较于标准ε-DP具有更紧的组合性质,但实际验证机制的隐私保证仍具挑战,尤其在黑盒场景下。现有f-DP审计方法通常需要预知算法内部结构,限制了实用性。本文提出全新的黑盒方法,无需任何先验知识即可估计f-DP的完整权衡曲线,并给出理论收敛保证。该方法融合非参数估计与最优分类理论,可统计确定性地检测f-DP违规。作者在多种DP机制(如拉普拉斯、高斯、指数机制等)上验证了估计与审计程序的有效性。主要贡献包括:1)首个通用的黑盒f-DP估计器,输出完整曲线;2)高效的审计方法,以统计置信度检测违规;3)理论收敛证明与实验验证。该工作适用于隐私保护机器学习、联邦学习、数据发布等场景,对隐私工程师、算法审计师及DP研究者具有参考价值。文中未提供具体攻击代码或绕过方法,仅专注于隐私评估技术。

💡 推荐理由: 差分隐私在现实部署中难以验证,尤其是黑盒场景。f-DP作为更精细的隐私模型,缺乏通用审计工具。该方法无需算法先验知识,可自动化评估隐私承诺,帮助安全团队检测隐私泄露或配置错误,提升合规审计能力。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
INFO
PAPER 2026-05-27

Symmetry Defeats Auditing

推荐 3.4
Conf: 50%
👥 作者: Nick Merrill, Zeke Medley

本文展示了一种针对内省适配器(Introspection Adapters)的攻击方法。内省适配器是一种用于审计大型语言模型内部状态的机制,旨在检测模型是否遵循安全约束。研究者发现,由于内省适配器依赖的对称性假设(例如,模型内部状态与审计信号之间的对称关系),攻击者可以通过破坏这种对称性来绕过审计。具体而言,攻击者可以微调模型参数或插入对抗性扰动,使得适配器输出的审计信号与模型实际行为解耦,从而在不触发告警的情况下执行有害操作。实验证明了该攻击的有效性,并揭示了当前审计范式中的根本缺陷。本文适合对AI安全、模型审计和对抗性攻击感兴趣的研究人员阅读。

💡 推荐理由: 该研究首次揭示了内省适配器的对称性脆弱性,挑战了当前LLM审计机制的有效性,可能影响依赖审计的合规场景。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.4)
推荐 9.5
Conf: 50%
👥 作者: Linkang Du, Xuanru Zhou, Min Chen 0032, Chusong Zhang, Zhou Su, Peng Cheng 0001, Jiming Chen 0001, Zhikun Zhang 0001

本文是一篇系统化知识(SoK)论文,聚焦于机器学习系统中数据集版权的审计问题。随着ML模型规模增大,训练数据需求激增,但未经授权的数据使用(如在线艺术作品或人脸图像)引发了严重的侵权与滥用问题。为应对此挑战,研究者提出了多种审计方法,但现有方案在审计假设和能力上差异显著,且鲁棒性评估往往仅覆盖ML流水线的部分环节,难以反映真实世界应用中的表现。本文从实际部署视角出发,系统梳理了数据集版权审计研究,将其分为两大类:侵入式方法(需修改原始数据集)和非侵入式方法(无需修改数据集)。侵入式方法细分为多种水印注入选项,非侵入式方法则利用不同的指纹技术。论文提供了详细的参考表格,总结了关键点,并指出了当前文献中未解决的问题。最后,结合ML系统流水线并分析先前研究,强调了使审计工具更适用于真实版权保护需求的未来方向。本文有助于安全从业者理解现有审计方法的优劣与适用场景。

💡 推荐理由: 本文系统梳理了ML数据集版权审计方法,帮助安全工程师快速了解侵入式与非侵入式技术的优缺点,为实际部署提供参考。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
推荐 9.5
Conf: 50%
👥 作者: Meenatchi Sundaram Muthu Selva Annamalai, Borja Balle, Jamie Hayes, Emiliano De Cristofaro

本文研究了使用洗牌(shuffling)机制替代传统泊松子采样的差分隐私随机梯度下降(DP-SGD)算法在隐私保证上的实际效果。泊松子采样是DP-SGD的标准做法,但洗牌因其更好的兼容性和较低的计算开销而被广泛采用。然而,洗牌下的严格理论差分隐私(DP)保证计算仍是一个开放问题,导致实际训练中常以泊松子采样的标准来评估,可能产生不准确的隐私保障。作者提出了新颖的DP审计程序,专门用于分析洗牌机制下的DP-SGD,并能紧密估计隐私泄露程度与批次大小、隐私预算及威胁模型的关系。实验表明,使用洗牌训练的模型其隐私保证被严重高估(最多达4倍),且该差距在不同参数设置和威胁模型下并非均匀。此外,还发现两种常见的洗牌变体会导致更严重的隐私泄露(最多达10倍)。本工作强调了在缺乏严格分析方法的情况下使用洗牌替代泊松子采样的风险,为后续研究提供了审计工具和实证依据。

💡 推荐理由: 洗牌机制在DP-SGD中广泛应用,但实际隐私保证可能被严重高估,本审计方法能帮助安全工程师准确评估模型隐私风险。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)