#provenance

共收录 10 条相关安全情报。

← 返回所有主题
👥 作者: Ian C. Moore, Fernando Paredes Garcia

本文提出并分析了 Parent-Hash 有向无环图(PHDAG),这是一种用于链上注册表的追加型数据结构,其中每次追加操作只需对之前未触及的存储槽进行恒定数量的写入操作。此前,PHDAG 从未被作为独立原语进行形式化分析,也未被明确边界常数,更未与标准的增量 Merkle 树(IMT)进行基准比较。作者形式化证明 PHDAG 的追加操作在 gas 成本上为 O(1),与注册表大小和树深度无关,而 IMT 的每次插入成本则是关于叶子索引的随机变量,作者推导出其均值和方差的闭式表达式。通过在 Base Sepolia 测试网上对 1 至 25 层树深度进行实验验证,观察到 PHDAG 的 gas 消耗恒定在约 76,276 gas(标准差约 6 gas),而 IMT 成本随深度线性增长。交叉点(IMT 更便宜)远低于所有已调查生产注册表的深度。此外,本文还建立了从公共事件日志中无需信任地重建注册表的方法,时间复杂度为线性,且无需链下依赖。该研究首次将 PHDAG 与 IMT 进行了系统的理论和实证对比,为链上数据结构的成本优化提供了重要参考。

💡 推荐理由: 该研究为链上注册表(如证书透明度、软件供应链)的数据结构选择提供了严格的成本分析,帮助开发者理解 PHDAG 在深度较大时的 gas 优势,从而优化智能合约设计。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Yiqi Wang, Jiaqi Zhang, Taotao Cai, Zirui Liu, Qingqiang Sun, Zequn Sun, Zhangkai Wu, Mingkai Zhang, Yanming Zhu

本文系统综述了基于大语言模型(LLM)的智能体中证据追踪与执行溯源问题。随着LLM智能体通过与外部工具、检索系统、记忆模块、环境及其他智能体交互解决复杂任务,其自主性增强,但行为验证、调试和审计难度增加。仅靠最终答案正确性无法解释输出如何产生、每个主张依赖哪些证据、工具调用是否合理、记忆如何影响后续决策、以及执行失败的根源。证据追踪与执行溯源通过建模智能体执行过程中检索证据、工具输出、记忆项、环境观察、中间主张、动作与最终答案之间的关联来弥补这一空白。本文提出统一溯源视角,连接检索归因、主张支持、工具使用安全、记忆谱系、可观测性、调试、审计与恢复。引入分类法涵盖追踪来源、证据与执行单元、溯源关系、追踪粒度与时机、表示形式及信任函数。综述关键方法论方向,包括溯源表示、证据归因、工具使用溯源、运行时护栏、携带溯源的记忆、基于轨迹的可观测性及故障诊断。同时映射现有基准、数据集与评估指标至溯源相关能力,讨论评估如何从最终答案正确性转向过程级问责。最后,概述开放挑战,如统一轨迹模式、主张级与语义溯源、感知溯源的安全机制、真实执行轨迹基准、面向恢复的评估及隐私感知审计基础设施。本文适合AI安全、LLM可靠性及智能体治理领域的研究者和工程师阅读。

💡 推荐理由: 该综述系统梳理了LLM智能体可解释性与可信性的核心挑战,提出了统一溯源框架,为构建可审计、可调试的智能体系统提供了理论基础,对AI安全从业者理解智能体行为追踪与风险管控具有重要参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Shubhashis Sengupta, Benjamin McCarty, Milind Savagaonkar, Rhine Andotra

这篇论文探讨生成式AI(GenAI)对内容真实性带来的系统性风险。作者提出了“真实性债务”(authenticity debt)概念:组织在部署AI生成内容时,若未保留可验证的来源、完整性和问责机制,将累积机构性负债,未来可能在监管、法律或市场审查下暴露。论文首先构建了生成式AI危害与攻击向量的多维分类法,涵盖真实性、来源(provenance)、完整性和问责四个层面。随后,系统评估了现有技术控制手段的能力与局限性,包括数字水印(如DALL-E水印)、来源框架(C2PA、Adobe CAI)和检测技术(AI生成文本/图像检测)。核心论点是:在开放、对抗且不断演化的环境中,没有任何单一机制足以保障内容真实性。受零信任架构和企业治理框架启发,作者提出一个分层参考架构,融合密码学来源(如数字签名、区块链)、人在回路验证和持续治理,以实现大规模可防御的真实性。论文还分析了欧美监管环境(EU AI Act、美国FTC指南、NIST AI RMF),并为组织提供实践指导原则,建议将真实性建设视为机构基础设施而非事后补救。该研究适合安全架构师、合规官和AI系统设计者阅读,以理解GenAI时代内容信任的挑战及系统性解决方案。

💡 推荐理由: 为防御者提供了系统性框架来管理AI生成内容的风险,尤其适合SOC和合规团队用于构建内容溯源和完整性验证策略。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Bing Liu, Shunping Wang, Yufan Zhu, Xinyi Yu, Jing Huang, Linkang Du, Hongbin Pei, Wei Luo

本文是一篇针对大型语言模型(LLM)领域内指纹识别与水印技术的综述论文,旨在统一术语、生命周期阶段和评估目标,为LLM资产保护与溯源建立结构化基础。LLM的研发需要大量数据、算力和专业知识,且正被部署于高风险场景,因此保护LLM相关资产并追踪其来源至关重要。现有工作已在数据集溯源、模型所有权验证和生成内容检测等方面快速扩展,但该领域仍存在碎片化现象:指纹识别与水印的术语使用不一致,方法通常仅在孤立的资产特定场景中研究。为弥补这一差距,论文引入“隐式身份”(implicit identity)作为统一抽象概念,指LLM系统中可验证但不可直接观察的身份信号。区分了两种类型:指纹识别(从内在特性中提取的非侵入式身份)和水印(有意嵌入数据、模型或生成内容中的侵入式身份)。基于此,提出了一个生命周期分类法,将技术按数据集、模型和生成内容三个层面组织,并进一步按验证语义(基于相似性的归因VS基于密钥的验证)细分。最后,建立了一个以可识别性、鲁棒性和可部署性为核心的评估框架,总结了在现实访问和变换场景下的代表性指标。通过统一术语、生命周期阶段和评估目标,该综述为研究LLM身份技术以及开发更可靠的资产保护和溯源机制提供了结构化基础。适合LLM安全研究人员、模型开发者、内容归因系统设计者阅读。

💡 推荐理由: LLM资产保护与溯源成为关键需求,本文首次系统梳理指纹与水印技术,统一术语与评估框架,有助于安全社区建立共识、推动可靠防护方案落地。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Kolawole Quadri

该论文提出了KYA(Know Your Agents),一个框架无关的自主系统信任与治理层,旨在解决AI智能体运行中可能出现的错误、偏离、数据泄露或恶意行为等问题。K YA由五个核心原语组成:(1) 四门入站应用管道,结合Ed25519签名验证与多锚点固定、持久时间过期、仅收紧组合以及默认操作员批准;(2) 在三级多租户层次结构(平台默认、租户覆盖、签名外部推荐)上的仅收紧组合代数;(3) KYP(Know Your Principal),一个跨人类用户、AI智能体和服务账户的统一信任评分模式;(4) 可审计的交互乘数放大,基于AIVSS形状的加性基线,带有稳定审计码的有界非对称每交互乘数;(5) 双轴委托归因,结合静态观察门控委托信任溢价与三个SDK钩子表面的零配置运行时编排器责任归属。KYA框架无关,兼容22个智能体框架。纯函数评分器p99延迟小于1毫秒,系统在20个并发工作线程下维持约1800 ops/秒,HMAC链完整性端到端保持。四门入站应用管道在所有测试中拒绝伪造、过期、宽松和未批准的推荐(1200/1200),SQLite上p99延迟小于1毫秒。KYA能检测89%的对抗性探测(来自PyRIT和Garak的1200个探测),包括最近发布的拓扑引导多智能体攻击。该系统以Apache 2.0许可证发布,作为veldt-kya包在PyPI上可用(提交时为候选版本,稳定版v0.1.0即将发布)。

💡 推荐理由: KYA为自主系统的安全治理提供了框架无关的标准化信任层,可对抗智能体漂移、数据泄露和恶意行为,对蓝队监控和治理多智能体环境具有重要意义。

🎯 建议动作: 关注研究进展,评估将KYA集成至现有智能体治理管道的可行性

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Gustav Olaf Yunus Laitinen-Fredriksson Lundström-Imanov, Nurana Abdullayeva

本文提出一个统一的证据框架,将密码学内容来源、鲁棒统计水印和零知识证明映射到三个法律体系(国际军事行动法、国内诉讼程序、产品监管)的证明要求中。该框架定义了一个五级威胁模型,涵盖从朴素再生、对抗性清洗、跨模型再生、主动水印移除到内部来源伪造。作者发布了包含12000个生成项(涵盖图像、音频、视频模态)的公开基准,并经过六种清洗管道处理,得到72000个评估样本。他们对四种代表性方案进行了评估,报告了在固定假阳性率下的真阳性率、鲁棒性曲线下面积、计算开销以及针对不同法律体系的条件法律充分性评分。最终将实证检测边界转化为法律充分性阈值,用于武装冲突法中的指挥决策、国内刑事和民事程序中的可采性,以及欧盟人工智能法案下的持久性审计。该成果提供了一个可复现的参考管道、公共基准和模型附件,可供律师、工程师和操作人员共同部署。

💡 推荐理由: 本文首次将AI生成内容的可验证来源与水印技术系统性地映射到法律证据要求,为安全从业者提供了跨学科的技术-法律评估基准,有助于在合规场景中设计可辩护的防御方案。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Tom Sander, Hongyan Chang, Tomáš Souček, Tuan Tran, Valeriu Lacatusu, Sylvestre-Alvise Rebuffi, Alexandre Mourachko, Surya Parimi, Christophe Ropers, Rashel Moritz, Vanessa Stark, Hady Elsahar, Pierre Fernandez

本文提出 TextSeal,一种用于大型语言模型(LLM)的本地化水印方案,旨在解决模型输出的来源追踪与蒸馏保护问题。该方法基于 Gumbel-max 采样,通过引入双密钥生成机制恢复输出多样性,并利用熵加权评分和多区域定位技术提升检测精度。TextSeal 支持推测解码和多 token 预测等服务优化,且不引入任何推理开销。在检测强度上,TextSeal 严格优于 SynthID-text 等基线方法,对文本稀释具有鲁棒性,即使在人类与 AI 内容高度混合的文档中也能实现可靠的本地化检测。方案理论上是无失真的,在推理基准测试中下游性能保持不变;跨 5 种语言的 6000 次 A/B 人类评估显示无感知质量差异。除了用于来源检测,TextSeal 还具有“放射性”:其水印信号会通过模型蒸馏传递,从而能够检测未授权的模型使用。该工作适合 LLM 服务提供商、内容认证机构及模型安全研究人员阅读。

💡 推荐理由: 为 LLM 输出提供一种高效、鲁棒的本地化水印方法,在无推理开销的前提下实现强检测与蒸馏保护,对内容溯源和知识产权保护具有重要实践意义。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Lingzhi Wang 0002, Xiangmin Shen, Weijian Li 0002, Zhenyuan Li, R. Sekar 0001, Han Liu 0001, Yan Chen 0004

该论文提出了一种新颖的入侵检测方法,通过将梯度信息融入基于溯源的检测规则中,实现了轻量级且自适应的入侵检测。传统基于溯源的入侵检测系统通常依赖静态规则或机器学习模型,但存在规则难以适应新型攻击或计算开销大的问题。本文方法首先利用图神经网络从系统溯源数据中提取特征,然后通过梯度优化来动态调整规则权重,使得检测规则能够根据实际数据分布自动更新,从而在保持低误报率的同时提高对未知攻击的检测能力。实验在多个真实数据集上进行,包括APT模拟攻击和普通系统活动,结果表明该方法在检测率、误报率和计算效率上均优于现有的基线方法。该工作为入侵检测领域提供了一种兼顾准确性和实时性的新思路,特别适用于资源受限的环境。

💡 推荐理由: 提出一种将梯度优化与溯源的规则结合的方法,实现轻量、自适应入侵检测,有助于缓解现有基于规则或机器学习方法的局限性,提升对新型攻击的检测能力。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
推荐 9.4
Conf: 50%
👥 作者: Hailun Ding, Juan Zhai, Dong Deng 0001, Shiqing Ma

本文提出了一种利用机器学习技术优化溯源图存储系统的思路。传统溯源图存储面临规模大、查询慢等挑战。作者设计了一种学习型索引结构,通过对图数据的分布进行建模,实现了更高效的存储与检索。实验表明,该方法在存储压缩比和查询延迟上优于传统方法。该研究为安全取证中的大数据分析提供了新的工程方向。

💡 推荐理由: 溯源图是攻击溯源的核心技术,其存储效率直接影响安全运营中的实时查询能力。本工作将学习型索引引入该领域,有望提升大规模溯源数据的处理速度,值得蓝队关注。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.4)

提出基于溯源访问的子账户系统 PASS,通过 Inbox-Outbox 机制实现外部动作可验证溯源且内部转账私密,用于区块链钱包的灵活共享访问。

💡 推荐理由: 当前区块链钱包的私钥全权控制模式在 AI 代理、企业托管等场景中脆弱;PASS 提供可验证的溯源控制,有助于安全地实现多角色协调,减少秘密暴露和内部活动泄露风险。

🎯 建议动作: 研究跟进

排序因子: Community 数据源 (+1) | LLM 评分加成 (+0.5)