#model extraction 主题 - Cyber Security Daily Radar

👥 作者: Yuanxin Zhuang, Chuan Shi 0001, Mengmei Zhang, Jinghui Chen, Lingjuan Lyu, Pan Zhou 0001, Lichao Sun 0001

本文研究了一种针对图神经网络（GNN）的数据无模型提取攻击。传统的模型提取攻击通常需要访问目标模型的训练数据或大量查询，但在实际场景中，攻击者可能无法获取原始数据。作者提出了一种基于生成对抗网络（GAN）的方法，无需任何真实训练数据即可高效窃取GNN模型。具体地，攻击者首先训练一个生成器来合成与目标模型训练数据分布相似的图数据，然后利用目标模型对合成数据的预测作为标签来训练替代模型。通过交替优化生成器和替代模型，最终得到一个高保真度的克隆模型。实验在多个图分类和节点分类任务上进行，结果表明该方法在模型精度和迁移性上均优于现有基线，且对目标模型的结构和参数类型具有通用性。该工作揭示了GNN在数据不可见场景下面临的严重安全威胁，为后续防御研究提供了重要参考。

💡 推荐理由: GNN在社交网络、生物化学等敏感领域广泛应用，数据无模型提取攻击无需原始数据即可窃取模型，可能导致知识产权泄露或进一步的黑盒攻击，安全从业者需关注此类新型威胁。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Maxime Schwarzer, Johannes F. Loevenich, Gustavo Sánchez, Laurin Holz, Thies Möhlenhof, Tobias Hürten, Roberto Rigolin F. Lopes, Veit Hagenmeyer

该论文针对AI模型提取攻击（MEA）中防御策略普遍依赖的“单客户端假设”（Single Client Assumption, SCA）进行了系统性批判。SCA隐含假设攻击源自单一孤立身份，但论文指出，在高级持续性威胁（APT）等协同攻击者面前，该假设根本无效。作者提出了一个模块化、开源的模型窃取研究框架CerberusAI，并利用它模拟分布式攻击场景。实验评估表明，主流防御机制（如PRADA，Protecting Against Deep Neural Network Model Stealing Attacks）在面对简单的轮询查询分发策略时，检测性能显著下降；甚至全局聚合方法也可通过自适应流量混合被绕过。这些结果揭示了模型提取攻击防御领域需要向有状态、身份无关的防御架构进行范式转移。该论文最初发表于2026年ICMCIS会议，并获得最佳论文奖。对于安全从业者而言，该研究挑战了现有防御体系的根基，提示需要重新设计能够抵御分布式攻击的模型保护方案。

💡 推荐理由: 揭示了当前AI模型提取防御依赖的单客户端假设在协同攻击（如APT）下完全失效，可能误导安全团队对防御效果的评估，亟需转向更鲁棒的防御架构。

🎯 建议动作: 研究跟进，评估现有防御系统对分布式攻击的脆弱性，并探索基于有状态的身份无关防御方案。

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)

Cyber Security Daily Radar

#model extraction

Unveiling the Secrets without Data: Can Graph Neural Networks Be Exploited through Data-Free Model Extraction Attacks?

AI Model Extraction Attacks: Bypassing Single-Client Assumptions in Defenses