#federated learning 主题 - Cyber Security Daily Radar

👥 作者: Suleiman Muhammad Sabo, Hamed Alkharsh, Peilin Li, Chuadhry Mujeeb Ahmed, Aydin Abadi, Shishir Nagaraja, Rajiv Ranjan

本文研究无人机群中基于联邦学习（FL）的边缘智能系统的安全性，提出了一种链式攻击方法，结合网络层拒绝服务（DoS）和凭据冒充。攻击者首先利用802.11去认证攻击强制合法无人机离线，然后使用窃取的凭据冒充已断线的无人机重新加入FL训练。作者通过系统文献综述和基于Flower框架的实验验证，在Raspberry Pi和Jetson两种测试平台上，分别针对独立同分布（IID）和非独立同分布（Non-IID）数据分布，评估了可用性中断的影响。实验表明，即使短暂的无线中断也会导致训练显著不稳定，尤其在Non-IID条件下更为严重；而单因素认证机制使得攻击者能够在断线后无缝冒充节点。论文讨论了这对关键任务无人机部署的复合影响，并提出了未来防御方向，需同时解决可用性和认证漏洞。该研究适合安全研究人员、无人机系统开发者和联邦学习从业者阅读。

💡 推荐理由: 揭示了无人机联邦学习系统中网络攻击与身份认证漏洞的链式利用途径，对边缘智能部署的安全性敲响警钟。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Fawaz J. Alruwaili, Cihan Tunc

该论文针对无人机蜂群网络中的入侵检测问题，提出了一种基于联邦学习（FL）与知识蒸馏（KD）的轻量级入侵检测系统（IDS）。无人机蜂群在监视、灾难响应等关键任务中广泛应用，但其开放通信信道和有限计算资源使其易受网络攻击。传统的机器学习方法需要收集所有异构无人机的数据到中心服务器处理，不可行且存在隐私风险。联邦学习提供分布式解决方案，但现有FL-IDS框架面临通信和计算开销大的挑战。作者采用深度神经网络（DNN）结合知识蒸馏来降低模型复杂度和通信成本，同时保持检测性能。在Raspberry Pi 4设备和真实无人机网络数据集上评估，该方法实现了约98.6%的检测准确率，同时降低约70%的通信开销和29%的计算开销。结果表明，FL与KD结合是资源受限无人机网络中安全高效部署的实用方案。论文适合无人机网络安全研究人员、联邦学习应用开发者以及物联网安全从业者阅读。

💡 推荐理由: 为资源受限的无人机蜂群提供了一种高效、轻量的入侵检测方案，解决了联邦学习在无人机环境中的通信与计算瓶颈，对提升无人机网络安全性具有重要参考价值。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Santhosh Parampottupadam, Andres Martinez, Dimitrios Bounias, Sinem Sav, Klaus Maier-Hein, Ralf Floca

联邦学习（FL）允许多机构在不共享原始数据的情况下联合训练临床文本模型，但梯度反演可能从共享的模型更新中重建敏感信息。本文系统量化了放射学报告中基于梯度的文本重建风险，并比较了三种分词器（GPT-2、RadBERT、LLaMA-2）对隐私泄露的影响，同时保持模型架构（GPT-2风格Transformer，序列长度32）固定。实验涉及六个FL客户端，在公共放射学语料库（368,751份诊断报告、98,206份出院小结、1,500份MIMIC-CXR自由文本报告）上训练，批大小设置为64、128和256。假设存在主动恶意的服务器，在分发前修改共享架构，作者应用解析梯度反演方法，测量五次运行的重建保真度。结果显示，不同分词器的精确句子重建率为31%至44%（在27个分词器×数据集×批大小的组合中为30.6%至43.5%）。在出院数据集上，批大小为64时，GPT-2、RadBERT和LLaMA-2的准确率分别为42.1%、42.3%和39.4%；批大小增至256时，分别降至37.3%、37.2%和34.3%。S-BLEU随批大小增加而下降（GPT-2：0.44降至0.33；RadBERT：0.48降至0.35）。RadBERT取得了最高的重建保真度，并恢复了最多的临床术语（占1,440个参考词汇的18.1%，而GPT-2为12.5%，LLaMA-2为9.4%）。然而，没有分词器能完全防止泄露。研究表明，即使在较大批大小和领域专用分词器下，报告文本的相当大一部分仍可从FL梯度中恢复。分词器设计不仅影响效用，还影响隐私风险严重程度；要满足HIPAA和GDPR对放射学NLP中FL的要求，可能需要安全聚合和差分隐私等保障措施。

💡 推荐理由: 该研究首次系统比较了不同分词器在联邦学习中导致的隐私泄露差异，揭示分词器设计是影响梯度反演风险的关键因素，对于医疗NLP应用中的隐私保护具有重要指导意义。

🎯 建议动作: 研究跟进，考虑在联邦学习部署中评估分词器选择对隐私的影响，并引入差分隐私等防护机制。

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Kaiyuan Zhang 0002, Siyuan Cheng 0005, Guangyu Shen, Bruno Ribeiro 0001, Shengwei An, Pin-Yu Chen, Xiangyu Zhang 0001, Ninghui Li 0001

该论文针对联邦学习中的梯度反转攻击提出了一种新的防御方法 CENSOR。联邦学习中，客户端发送梯度更新至中央服务器，但梯度可能泄露原始训练数据的隐私信息。现有的梯度反转攻击可以从梯度中恢复出训练样本，而现有防御方法在高维模型参数下效果有限。CENSOR 利用模型参数的高维特性，通过将梯度投影到与原始梯度正交的子空间中进行扰动，并采用冷后验（cold posterior）在正交子空间上进行贝叶斯采样，从而选择一个既能有效防御梯度反转攻击又能保持模型效用的最优梯度。作者在三个不同数据集上进行了全面实验，与多种先进攻击和防御方法对比，证明了 CENSOR 在防御性能和模型效用之间的良好平衡。该方法特别适用于大型神经网络模型，为联邦学习隐私保护提供了新的思路。

💡 推荐理由: 联邦学习中的隐私泄露风险严重，该工作提供了一种新的可证明有效的防御机制，尤其针对高维模型，有助于在实际部署中保护客户端数据。

🎯 建议动作: 研究跟进

排序因子: 有可用补丁/修复方案 (+3) | 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Taym Alshoghri, Deemah H. Tashman, Mohammad Reza Gerami, Soumaya Cherkaoui

本文针对医疗物联网（IoMT）设备在资源受限、数据高度敏感以及联邦学习（FL）引入的隐私风险背景下，提出了一种结合后量子密码学（PQC）与边缘原生编排的安全框架。研究首先分析了IoMT面临的三重挑战：传统轻量级密码在量子计算下的脆弱性、FL模型更新可能泄露医疗隐私、以及设备计算和能源限制。为此，作者设计了一套基于Kubernetes的可扩展架构，集成后量子密钥建立、轻量级加密和边缘原生调度能力，并在Raspberry Pi实验平台上进行了验证。实验结果表明，分布式密码处理相比顺序设计能显著降低延迟，同时保持可接受的资源开销。论文的主要贡献在于为支持FL的IoMT系统设计并验证了一套安全编排与通信框架，并展望了能量感知架构、智能安全优化以及下一代智能医疗物联网（IIoMT）生态系统的发展方向。本研究适合关注医疗设备安全、后量子密码应用及边缘计算的研究者和工程师阅读。

💡 推荐理由: 随着量子计算发展，IoMT设备依赖的传统加密面临风险，本文提出的后量子安全框架为医疗数据长期保护提供了可行路径。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: John Fields, K M Sajjadul Islam, Ruchitha Thota, Victor Chen, Praveen Madiraju

该论文提出了一种基于远程数据科学（RDS）的隐私保护机器学习（PPML）框架，用于跨机构学生保留率预测。研究利用PySyft平台，设计了一个半气隙架构，包括高侧和低侧服务器，使得来自三所大学的研究人员能够在敏感学生数据上构建预测模型，而无需直接访问原始数据。实验使用一所小型私立大学的历史数据（N=720），评估了三种合成数据生成方法，并提出了一种名为“数据类型感知模板”（Data-Type-Aware Templates）的新型合成数据方法，该方法优先考虑隐私而非分布保真度。通过跨机构协作验证，该框架在不同机构间保持一致的分类性能（Macro F1: 0.690-0.695），同时严格遵守美国《家庭教育权利和隐私法案》（FERPA）。研究表明，基于RDS的PPML在教育场景中技术上可行，并且是小规模跨机构合作中联邦学习的一种实用替代方案。论文代码已开源。

💡 推荐理由: 该研究为教育机构提供了一种合规共享敏感数据、协同建模的可行路径，有望推动隐私保护机器学习在教育领域的实际应用。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Sheng Wan, Dashan Gao, Hanlin Gu, Lixin Fan, Daning Hu, Qiang Yang

该论文首次系统性地研究了基于logit的联邦学习（FL）中隐藏的隐私风险。传统的参数化FL通过交换模型权重或梯度来保护数据隐私，而新兴的logit-based FL方法则在公共数据上共享模型输出（logits），从而促进模型异构性、降低通信开销并增强客户隐私。然而，这些方法的隐私风险被严重忽视。本文提出并分析了一种半诚实服务器（对手）通过学习训练过程中的历史logits来窃取客户私有模型的自适应模型窃取攻击（AdaMSA）。作者从理论和实验两方面证明了这一隐私风险的存在，即使在公共数据与私有数据无关的情况下，风险依然存在。为应对这一威胁，他们提出了一种简单而有效的防御策略：在传输logits时添加扰动，方向是使隐私风险最小化同时最大限度保持训练性能。实验结果表明，AdaMSA能够有效窃取模型，而防御策略能在少量影响性能的前提下显著降低隐私泄露。该研究为logit-based FL的安全性提供了重要理论基础和实用解决方案，并提醒社区注意这一被忽视的隐私漏洞。

💡 推荐理由: 联邦学习是保护数据隐私的关键技术，logit-based方法因其优势被广泛采用，但其隐私风险尚未被充分认识。本研究揭示了即使公共数据无关，攻击者仍能窃取私有模型，并提供了可落地的防御方案，对使用logit-based FL的企业和研究机构具有高度警示意义。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Vincenzo Sammartino

该论文提出了一种名为Q-FE的量子原生6G远边缘架构，旨在解决超密集工业物联网（IIoT）数字孪生场景下的安全与延迟挑战。当前架构依赖集中式云或移动边缘计算（MEC）服务器进行数字孪生计算，导致往返延迟过高，且使用易受量子攻击的经典公钥密码。Q-FE通过三个协同设计组件应对这些问题： 1. 微数字孪生（μDTs）与6G基站和高能力端点共存，减少通信跳数； 2. 跨层后量子密钥交换模块将CSIDH-512同源密钥材料直接嵌入MAC层控制帧，利用其紧凑密钥（≤64字节）避免数据包分片，相比ML-KEM/Kyber-1024降低62%的MAC层开销； 3. 异步联邦学习（AFL）协议由MEC节点上的轻量级DAG智能合约管理，消除落后者瓶颈，防止模型投毒和女巫攻击，且不暴露原始数据。基于NS-3和PySyft的端到端仿真表明：Q-FE将P99.9超可靠低延迟通信（URLLC）维持在0.78 ms，全局模型收敛速度比同步联邦学习提升31%；协议复杂度为每轮O(N log R)；μDT切换迁移在模拟的10^4个事件中平均完成时间为1.9±0.3 ms。形式化威胁模型证实其对量子窃听、模型投毒和女巫攻击具有韧性。该工作适合网络架构、后量子密码和联邦学习领域的研究者阅读。

💡 推荐理由: Q-FE首次将CSIDH后量子密钥交换与异步联邦学习深度融合到6G边缘架构中，为工业物联网数字孪生提供了抗量子、低延迟、防投毒的安全通信与计算框架，对6G安全标准化具有前瞻意义。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)

👥 作者: Xiaoyu Cao, Jinyuan Jia 0001, Zaixi Zhang, Neil Zhenqiang Gong

联邦学习易受到投毒攻击，恶意客户端通过发送恶意模型更新来破坏全局模型。现有防御主要关注在攻击发生时通过鲁棒聚合或客户端检测来阻止少数恶意客户端，但如何在检测到恶意客户端后高效恢复全局模型仍是一个开放挑战。简单的从头训练方法计算和通信开销巨大，不适合资源受限的客户端（如智能手机和物联网设备）。本文提出 FedRecover，一种利用历史信息从投毒攻击中恢复准确全局模型的方法，且客户端的计算和通信成本极低。核心思想是服务器在恢复过程中利用存储的历史信息（包括每轮的全局模型和客户端模型更新）来估计客户端更新，而非要求客户端实际计算和通信。此外，通过预热、周期性修正、异常修复和最终微调等策略进一步优化，使恢复的模型更准确。理论分析表明，在某些假设下 FedRecover 恢复的全局模型与从头训练恢复的模型接近或相同。在四个数据集、三种联邦学习方法以及无目标和有目标投毒攻击（包括后门攻击）上的实验验证了其准确性和效率。适合联邦学习安全研究者、系统设计者以及对投毒攻击防御恢复感兴趣的读者。

💡 推荐理由: 联邦学习投毒攻击后的模型恢复长期未被有效解决，FedRecover 提供了一种轻量级、可落地的恢复方案，显著降低计算和通信开销，对资源受限场景尤为重要。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Chun Yin Chiu

该论文研究了在云-边缘安全分析中，联邦学习（FL）用于入侵检测时的客户端选择问题。在生产环境中，由于带宽异构、掉队者和掉线等问题，服务器可能依赖过时的客户端信息，影响检测的时效性和鲁棒性。作者将客户端选择建模为时效感知的系统问题，引入“信息年龄”（Age of Information, AoI）概念，并提出了三种轻量级策略：AoI优先、效用优先以及混合AoI+效用规则（带可调权衡参数）。在CIC-IDS2017 DDoS/PortScan子集、NSL-KDD、ToN-IoT以及合成漂移基准数据集上，分别针对干净、投毒和投毒加鲁棒聚合设置进行实验。结果表明，与随机采样相比，AoI感知选择平均降低约39-41%的平均AoI和约70%的峰值AoI，同时保持固定的每轮通信预算。混合策略通常能维持Macro-F1/AUC，并提供可解释的旋钮来平衡新鲜度、检测质量和鲁棒性，但在加入误报率指标后并非严格Pareto最优。鲁棒性通过将AoI引导选择与修剪均值聚合结合在标签翻转投毒下评估，但选择策略本身并非独立的拜占庭防御机制。主要实践启示是：云-边缘隐私保护入侵分析可以通过轻量级调度层改善时效性，而无需改变底层FL参与预算。

💡 推荐理由: 针对联邦入侵检测中客户端陈旧数据导致的时效性下降问题，提出信息年龄引导的选择策略，可显著降低信息年龄，提升检测及时性，对实际云-边缘安全分析具有直接参考价值。

🎯 建议动作: 研究跟进：阅读全文并评估在自身联邦入侵检测系统中应用AoI引导选择的可行性。

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Liwei Zhang, Linghui Li, Xiaotian Si, Ziduo Guo, Xingwu Wang, Kaiguo Yuan, Bingyu Li

本文针对联邦学习中的成员推断攻击提出了一种统一的防御框架。成员推断攻击旨在判断某个特定数据样本是否被用于训练模型，严重威胁用户隐私。现有防御方法存在计算开销大或可用性-隐私权衡不佳的问题。作者提出通过知识蒸馏和贡献感知聚合来协同防御：首先，服务器利用全局模型对客户端更新进行蒸馏，生成软标签指导本地训练，减少过拟合从而降低成员推断风险；其次，引入贡献感知聚合机制，根据客户端数据质量动态调整聚合权重，使聚合器对异常更新更鲁棒。实验在多个基准数据集（如CIFAR-10、MNIST）上验证，结果表明该方法在保持模型可用性的同时，显著降低了成员推断攻击的成功率（AUC下降超过10%），且计算开销低于现有对抗训练方法。该框架无需修改客户端训练过程，易于部署。

💡 推荐理由: 联邦学习中的成员推断攻击是重大隐私威胁，本工作提供了一种实用且高效的统一防御方案，对隐私合规要求高的场景（如医疗、金融）有直接应用价值。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.6)

Cyber Security Daily Radar

#federated learning

Chained Attacks on Drone-Based Federated Learning: From Network Disruption to Device Impersonation

Federated Lightweight Intrusion Detection in Drone Swarms with Knowledge Distillation

Privacy Leakage in Federated Learning in Radiology Reports: A Comparative Evaluation of Tokenizer-Driven Privacy Risks

CENSOR: Defense Against Gradient Inversion via Orthogonal Subspace Bayesian Sampling.

Securing the Future of IoMT in the Post-Quantum Era: An Edge-Native Federated Learning Approach

A Privacy-Preserving Framework Using Remote Data Science for Inter-Institutional Student Retention Prediction

Quantifying and Defending against the Privacy Risk in Logit-based Federated Learning

Q-FE: A Quantum-Native 6G Far-Edge Architecture Securing Industrial IoT Digital Twins via CSIDH-PQC and Asynchronous Federated Learning

FedRecover: Recovering from Poisoning Attacks in Federated Learning using Historical Information.

AoI-Guided Client Selection for Robust and Timely Federated Intrusion Detection in Cloud-Edge Security Analytics

A Unified Defense Framework Against Membership Inference in Federated Learning via Distillation and Contribution-Aware Aggregation.