#knowledge-graph 主题 - Cyber Security Daily Radar

👥 作者: Federico Valletta, Giacomo Longo, Enrico Russo, Alessio Merlo

安全运营中心（SOC）越来越依赖自动化工具将网络威胁情报（CTI）报告映射到MITRE ATT&CK框架，但提取器的输出仍然存在错误，且通常不附带证据、溯源和验证历史，导致难以判断单个映射的可信度。本文提出TRACE-CTI，一个事后提取声明治理框架，它保留运行级预测，聚合成配置级图断言，将重复配置去重后的验证结果作为共识断言，并仅暴露受政策合规验证支持的图断言。该框架保留了原生证据粒度、完整的提取溯源、带版本的可信决策以及非破坏性撤销历史。作者在两个公开CTI语料库（共65份报告、5303个句子）上评估了TRACE-CTI，使用2×3的检索器与生成器组合矩阵，并分6个图版本增量摄入。所有设置无需修改模式即可集成，溯源路径保持完整，操作范围互不重叠，每个可信图断言都有活跃的合格验证基础。跨生成器家族的设置对相比同家族对表现出更大的输出多样性。在最终图状态下，将设置支持从k≥1增加到六方一致，使gold-aligned精度从25.3%提升至90.6%，而召回率从88.2%下降至16.3%。该图还能直接回答关于溯源、可信度、版本控制、依赖关系、分歧和审查队列的七个问题，而评估的最小扁平输出在没有增强或重新处理的情况下无法完全回答这些问题。结果表明，所提出的框架能够对提取的TTP声明进行显式、可审计的治理；观察到的验证轨迹是描述性的，不建立统计独立性或因果模型族效应。

💡 推荐理由: 当前自动化CTI映射缺乏可审计性和信任机制，TRACE-CTI通过知识图谱保留完整证据链和验证历史，使SOC分析师能够基于可信度做出决策，显著提升攻击行为映射的可靠性。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Sourena Khanzadeh, Daniel Platnick, Marjan Alirezaie, Hossein Rahnama

本文针对现代AI系统在用户数据收集、集中控制和隐私侵犯方面的社会风险（如大规模监控、权力过度集中、用户自主权丧失），提出了一种面向隐私保护的联邦披露框架。作者认为用户需要一种主权系统来安全地拥有、治理和披露个人上下文数据，同时满足跨监管领域的合规要求（包括来源追溯、可解释性和策略遵守）。为此，他们提出了“视角感知AI”（Perspective-aware AI），将用户聚合的个人数据转化为结构化身份模型——Chronicle（时间知识图谱），该图谱随用户交互增长，并支持在联邦网络中安全地披露上下文。具体地，Chronicle持有者可以暴露一个可查询、授权的视图，供第三方代理在不集中存储任何用户数据的前提下进行查询。本文的核心贡献是提出了“来源保留Chronicle”（Provenance Preserving Chronicles, PPC）协议，这是一种联邦协议，它将每个持有者的Chronicle编译为紧凑的“授权证据子图”，遵循“分享不超过请求所需”的原则。协议机制包括：持有者保留本地数据主权；访问控制器基于领域专家本体投射出关系感知的视图；采用两阶段流程——先返回带有来源链接的文本摘要，仅在持有者明确批准后才释放原始工件。论文还形式化了问题定义，分析了现有区块链、P2P和持有者主权方案的差距，定义了核心构造，并在明确的威胁模型下勾勒了协议细节。本文属于前沿隐私保护与AI治理交叉领域的研究，适合对去中心化身份、最小权限披露、知识图谱隐私和安全合规感兴趣的读者。

💡 推荐理由: 该研究提出了一种基于最小必要原则的联邦数据披露协议，可直接用于减少AI系统中用户数据过度收集和滥用的风险。对于安全团队，这种架构思路可应用于数据泄露防护、跨域合规审计以及安全事件中的上下文共享。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Mouhamed Amine Bouchiha, Gregory Blanc

网络威胁情报（CTI）报告通常是非结构化、异构且包含噪声的，这限制了它们在自动化分析与推理中的直接可用性。网络安全知识图谱（CSKG）能够以结构化形式表示攻击实体、行动和关系，但从自由文本CTI中构建此类图谱仍然是一个挑战。现有方法通常依赖单一的大型语言模型（LLM）进行端到端的信息提取和补全，这会导致高昂的成本、有限的可控性和不稳定的性能。本文提出了TACTIC-KG，一个基于智能体的CSKG构建框架，它将任务分解为多个模块化的、专门的LLM智能体，分别负责信息提取、类型标注、验证和精炼。通过使用轻量级模型（3B-8B参数），TACTIC-KG在提升稳定性、召回率和图一致性的同时降低了部署成本。该框架实现了并评估了TACTIC-KG，与最新的先进系统进行了对比。在人工标注的CTI报告上的实验表明，智能体专业化在提取F1分数、类型标注准确性和结构图相似性方面始终优于更大的单体语境学习（ICL）基线方法。这项工作为利用小型专家智能体团队构建高质量CTI知识图谱提供了可扩展且经济高效的解决方案。

💡 推荐理由: 该研究为自动化CTI知识图谱构建提供了一种更稳定、低成本的方法，通过智能体专业化克服了单一LLM的不足，有助于蓝队更高效地利用非结构化威胁情报进行分析和关联。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Basant Agarwal, Dincy R. Arikkat, Swati Yadav, Serena Nicolazzo, Antonino Nocera, Vinod P

本文针对当前威胁环境中，CVE/NVD 等漏洞数据库缺乏与攻击者行为（如 MITRE ATT&CK 战术和技术）的显式关联，导致安全团队难以快速理解漏洞的实际利用后果问题，提出了一种将软件漏洞与攻击行为模式链接的知识图谱构建方法。作者首先构建了一个包含 24,820 个实体和 43,608 个关系的高质量标注数据集，用于训练实体和关系抽取模型。在行为识别方面，采用基于 Transformer 的模型（CySecBERT）对 CVE 描述进行分类，在技术层面达到 87.71% 的 macro F1，在战术层面达到 96.16%。在信息抽取方面，分别评估了流水线方法（实体抽取 macro F1=0.86，关系抽取 macro F1=0.99）和基于跨度的联合模型（macro F1=0.78）。最终，所有抽取结果被整合到基于 Neo4j 的 Cyber Threat Knowledge Graph 中，支持结构化的漏洞-行为关联查询和可视化。该研究为安全分析师提供了一种自动将 CVE 映射到 ATT&CK 模型的工具，有助于提升威胁建模、攻击模拟和防御决策的效率。

💡 推荐理由: 该研究填补了漏洞数据库与攻击行为框架（MITRE ATT&CK）之间的语义鸿沟，让安全团队能够快速理解漏洞如何被用于真实攻击，提升威胁情报的实用性和自动化分析能力。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Jinze Gu, Qinghua Mao, Xi Lin, Jun Wu

该论文提出了一种针对基于知识图谱的检索增强生成（Graph RAG）系统的结构知识窃取攻击方法，称为GraphSteal。Graph RAG通过将知识图谱集成到检索管道中，使大语言模型能够利用结构化知识中的实体、关系和多跳依赖。然而，这种结构化知识同时引入了新的隐私风险：攻击者可以通过黑盒交互将Graph RAG系统转化为结构化预言机，逐步获取足够的关联证据以重建隐藏知识图谱的大部分内容。论文提出的重构框架包含两种策略：深度优先启发式搜索（Depth-Wise Heuristic Search）通过递归扩展以实体为中心的线索来提取细粒度的节点属性；广度优先扩散搜索（Breadth-Wise Diffusion Search）通过沿关系诱导的邻域传播来推断图拓扑。在通用医疗场景下的实验表明，该方法能从代表性Graph RAG系统中恢复超过90%的原始知识图谱，高保真地揭示敏感实体、关系和结构依赖。现有防护措施对此攻击的防御效果有限，凸显了保护Graph RAG管道中结构隐私的固有困难。该研究主要面向LLM安全、隐私保护以及RAG系统设计的研究人员。

💡 推荐理由: 该研究揭示了Graph RAG系统在结构隐私方面的新攻击面，攻击者无需内部权限即可高精度重建知识图谱，对依赖结构化知识的应用构成严重隐私威胁，安全从业者需重新评估RAG体系的安全假设。

🎯 建议动作: 内部评估现有Graph RAG系统的结构隐私暴露风险，研究对抗性查询检测与响应扰动机制。

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Yasmine Hayder

知识图谱（KG）作为链接数据的强大表示，具有灵活性、语义丰富性，并支持知识丰富化和推理，帮助数据所有者组织和利用异构数据提供个性化服务。然而，真实世界的知识图谱往往不完整，隐藏了真实事实或缺失有价值信息。知识图谱嵌入（KGE）技术常用于推断缺失信息，但基于KGE的推理可能无意中暴露敏感用户属性，即使此类数据未显式存储。本文研究了KGE推理带来的隐私风险，重点关注属性推断攻击：攻击者试图从看似非敏感的输出中推断用户敏感属性。我们提出并评估了一个框架，通过对KGE输出应用后处理消毒技术来缓解这些隐私风险。初步结果表明，此类攻击对KGE模型输出有效，并探索了采用随机化方法时推荐质量与隐私保护之间的权衡，突出了未来需要尝试更先进技术以解决该问题的必要性。

💡 推荐理由: 揭示知识图谱嵌入在推理过程中可能泄露用户敏感属性的隐私风险，为防御方设计隐私保护机制提供依据。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.4)

👥 作者: Ben Kereopa-Yorke, Guillermo Diaz, Holly Wright, Reagan Johnston, Ron F. Del Rosario, Timothy Lynar

本文定义了一种名为“Oracle Poisoning”的新攻击类别，攻击者通过破坏AI代理在运行时通过工具使用协议查询的结构化知识图谱，导致代理在正确推理的前提下得出错误结论。与提示注入不同，Oracle Poisoning操纵的是代理推理所依据的数据，而非指令。作者针对一个包含4200万节点的生产级代码知识图谱演示了六种攻击场景，首次在真实规模的代理系统中提供了知识图谱投毒的经验性证据，区别于传统的CTI嵌入投毒。主要评估使用来自三家提供商的九个模型的真实SDK工具调用（每个模型N=30），模型自主调用图查询工具并从结果中推理。结果明确：在中等攻击者复杂度（L2）下，每个测试模型以100%的概率信任中毒数据，在270次定向查询试验中有269次接受了伪造的安全声明。在开放式提示下，信任率下降至3-55%，证实提示框架是一个混杂变量；论文报告了两种条件。攻击者复杂度梯度揭示了离散的转折点，即信任从0%跃升至100%所需的最低技能水平，将攻击重新定义为“不是是否发生，而是程度如何”的问题。受控的交付模式比较表明，内联评估会产生假阴性：GPT-5.1在内联下显示0%信任，但在模拟和真实代理工具使用下均为100%，证明交付模式是一阶混杂变量。作者评估了五种防御措施；只读访问控制消除了直接修改向量，其余四种是部分且模型依赖的。对另外四个平台的分析表明，该攻击可能在知识图谱生态系统中普遍存在。

💡 推荐理由: 揭示了AI代理的一个关键新攻击面：数据源投毒可绕过推理完整性，且当前模型普遍缺乏防御能力。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)

FixV2W利用知识图谱嵌入和历史重映射模式，修正NVD中无效的CVE-CWE映射，提升漏洞管理准确性。

💡 推荐理由: 准确的CVE-CWE映射是漏洞管理的基础，NVD中大量映射错误导致自动化分析和风险判断失准。FixV2W通过轻量级方法显著改进映射质量，帮助安全团队更早识别和修复真实威胁。

🎯 建议动作: 评估FixV2W方法能否集成到现有漏洞管理流程中，验证其数据更新与迁移效果。

排序因子: 影响边界/网络设备 (+5) | Community 数据源 (+1) | LLM 评分加成 (+0.6)

Cyber Security Daily Radar

#knowledge-graph

TRACE-CTI: Auditable Post-Extraction Governance of TTP Claims with Knowledge Graphs

Share No More Than the Request Requires: Federated Disclosure for Perspective-Aware AI

TACTIC-KG: Toward Small Agent Teams for Cyber Threat Intelligence Knowledge Graph Construction

CVE-TTP KG: Knowledge Graph Linking Software Vulnerabilities to Attack Behaviors

GraphSteal: Structural Knowledge Stealing from Graph RAG via Traversal Reconstruction

Inferring Sensitive Attributes from Knowledge Graph Embeddings: Attack and Defense Strategies

Oracle Poisoning: Corrupting Knowledge Graphs to Weaponise AI Agent Reasoning

FixV2W: Correcting Invalid CVE-CWE Mappings with Knowledge Graph Embeddings