该论文提出了一种针对基于知识图谱的检索增强生成(Graph RAG)系统的结构知识窃取攻击方法,称为GraphSteal。Graph RAG通过将知识图谱集成到检索管道中,使大语言模型能够利用结构化知识中的实体、关系和多跳依赖。然而,这种结构化知识同时引入了新的隐私风险:攻击者可以通过黑盒交互将Graph RAG系统转化为结构化预言机,逐步获取足够的关联证据以重建隐藏知识图谱的大部分内容。论文提出的重构框架包含两种策略:深度优先启发式搜索(Depth-Wise Heuristic Search)通过递归扩展以实体为中心的线索来提取细粒度的节点属性;广度优先扩散搜索(Breadth-Wise Diffusion Search)通过沿关系诱导的邻域传播来推断图拓扑。在通用医疗场景下的实验表明,该方法能从代表性Graph RAG系统中恢复超过90%的原始知识图谱,高保真地揭示敏感实体、关系和结构依赖。现有防护措施对此攻击的防御效果有限,凸显了保护Graph RAG管道中结构隐私的固有困难。该研究主要面向LLM安全、隐私保护以及RAG系统设计的研究人员。
💡 推荐理由: 该研究揭示了Graph RAG系统在结构隐私方面的新攻击面,攻击者无需内部权限即可高精度重建知识图谱,对依赖结构化知识的应用构成严重隐私威胁,安全从业者需重新评估RAG体系的安全假设。
🎯 建议动作: 内部评估现有Graph RAG系统的结构隐私暴露风险,研究对抗性查询检测与响应扰动机制。