#cs.PF 主题 - Cyber Security Daily Radar

👥 作者: Vu Minh Chau, Nguyen Ngoc Kiet, Pham Quang Minh, Mai Xuan Ngoc, Nguyen Duc Anh, Hoang Ta

本文研究了在集成NPU（神经网络处理单元）的设备上实现和优化HQC（Hamming Quasi-Cyclic）解码算法。HQC是一种基于编码的后量子密码学密钥封装机制，已被NIST选为标准化候选算法之一。解码过程主要由Reed-Muller和Reed-Solomon两部分组成，计算开销巨大。作者针对Qualcomm Hexagon处理器（具有Hexagon Vector eXtensions HVX向量扩展）进行了优化，而非使用张量推理引擎。他们观察到HQC解码天然具有向量化计算特征，包括Reed-Muller可靠性向量、Hadamard变换系数、Reed-Solomon综合向量、有限域乘积和打包的支持点求值等。基于此，作者重新设计了核心解码内核，使其适应HVX友好的数据布局和执行模式，具体包括：向量化的Reed-Muller Hadamard变换、标量等效的峰值选择、面向HVX的有限域算术、向量化的综合计算以及缩短支持定位子根求值。作者通过Hexagon模拟器和骁龙8 Gen2硬件开发套件上的真实设备实验评估了优化后的解码器。结果表明，Hexagon/HVX辅助解码显著降低了延迟和能耗，能效提升高达18.13倍，同时大量减轻了主机CPU的负担。这些结果证明，当底层内核被重构以围绕向量执行时，集成NPU的移动平台可以有效支持结构化后量子密码解码。

💡 推荐理由: 后量子密码标准化在即，HQC作为候选算法要求高效实现。本文展示了移动设备NPU（特别是Hexagon HVX）可以大幅加速HQC解码，为移动端和嵌入式设备部署后量子密码提供了实用优化路径。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Ali Mahdavi, Azadeh Zamanifar, Amirfarhad Farhadi, Omid Kashefi

该论文提出了一种高效的联邦学习因果遗忘方法 HF-KCU，用于在不完全重训练的情况下移除特定客户的数据贡献，以满足隐私法规（如 GDPR）的数据删除要求。传统方法从头重训练计算成本极高（O(d^3)），而 HF-KCU 通过 Krylov 子空间中的共轭梯度迭代近似影响函数，将复杂度降至 O(kd)（k<<d）。其核心创新包括：(1) 因果加权机制，仅让持有被删除数据的客户端接收参数更新，避免对其他客户端产生虚假影响；(2) 能够处理有界对抗性扰动（对 Hessian 和梯度的扰动），在现实威胁模型下提供优雅的性能退化。实验在 CIFAR-10、MNIST、Fashion-MNIST 上使用 ResNet-18、SimpleCNN 和 ViT-Lite 架构验证：在 CIFAR-10 上，HF-KCU 比重训练快 47.75 倍，测试精度仅下降 0.60%（71.16% vs 71.76%）；成员推理攻击在遗忘集上的成功率为 0.499，与重训练模型一致，证明有效恢复了隐私。论文还提供了收敛性保证，证明 Krylov 近似误差随 O((κ^(1/2)-1)/(κ^(1/2)+1)) 衰减（κ 为 Hessian 条件数）。该方法的精确性和效率使其适用于异步删除请求且计算预算受限的生产联邦学习系统。

💡 推荐理由: 联邦学习需频繁响应用户数据删除请求，但重训练代价高昂。HF-KCU 以近乎无损的精度和数十倍加速实现高效遗忘，且能抵抗对抗性扰动，为合规性提供了切实可行的工程方案。

🎯 建议动作: 研究跟进，评估是否可集成到现有联邦学习框架中。

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Gabriel Garcia

本文研究了在共享全局上限的解码时（decode-time）场景下，多种KV缓存逐出策略（LRU, H2O, SnapKV, StreamingLLM, Ada-KV, QUEST, Random）的表现。作者发现，这些策略存在一个共同的漏洞：缺乏结构保护（structural protection）时，在六个纯Transformer模型上性能几乎崩溃（F1≤0.064）。通过在每次边界保留10%的缓存，在7个LongBench模型上，缓存上限C=256（仅保留13%的缓存）时恢复了69-90%的参考上限（C=2048）质量；在十个模型面板上恢复68-98%。注意力质量实验（Qwen2.5-3B, N=30）揭示了原因：位置0的sink token持有约75%的prefix质量，而其他边界token接近均匀期望的0.41倍，因此注意力评分器会保留sink token，但仍会丢弃结构上关键的token。有了保护，简化的评分隔离变体在K=32时与LRU等效（Δ=0.02），在K=8时注意力策略彼此收敛但在C=256和C=512时仍比LRU高0.011-0.021 F1。忠实实现的Ada-KV/QUEST在Mistral-7B和Phi-3.5上比简化变体额外提升约0.03-0.04 F1。在NIAH-32K长上下文场景（Qwen3-4B, C∈{512,2048}）下，保护提升效果几乎相同（比率0.99-1.00）。在64K长度时，保护有帮助但恢复有限；仅在模型本身无需逐出即可支持强64K检索时，忠实每头评分才能在6.3%保留率下匹配全缓存上限（Gemma-3-4B）。总体结论：结构保护占主导地位；一旦边界得到保护，评分差异是次要的；每头分配带来额外的适度提升。该研究揭示了当前缓存逐出策略的脆弱性，并强调了保护prompt边界的重要性，对LLM推理效率与质量平衡有重要指导意义。

💡 推荐理由: 本文揭示了主流KV缓存逐出策略在全局共享上限下的系统性缺陷，提出简单的结构保护即可大幅恢复性能，对于部署长上下文LLM的工程团队具有直接实践价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Abel C. H. Chen

该论文针对椭圆曲线集成加密方案（ECIES）面临量子计算技术发展带来的安全威胁，提出了一种基于密钥封装机制的集成加密方案（KEM-IES）。通过引入基于后量子密码（PQC）的密钥封装机制（KEM），KEM-IES显著增强了对量子攻击的抵抗能力。此外，研究还集成了美国国家标准与技术研究院（NIST）于2025年8月发布的Ascon算法，以进一步提升计算效率，并使其适用于嵌入式系统。作者在树莓派4上实现了所提出的KEM-IES及其基于Ascon的变体，并与ECIES进行了性能对比评估。实验结果表明，KEM-IES在保持安全性的同时，能够有效提升效率，为后量子时代的加密方案提供了新的思路。

💡 推荐理由: 为应对量子计算对现有加密方案的威胁，提供了一种结合后量子密码与轻量级算法的集成加密方案，对嵌入式系统的安全升级具有指导意义。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

👥 作者: Nazmus Salehin Sammo

该论文针对澳大利亚新支付平台（NPP）的后量子密码学迁移问题进行了蒙特卡罗模拟研究。NPP每日处理520万笔实时交易，服务等级协议（SLA）要求端到端延迟低于2000毫秒。随着量子计算机预计在2030-2035年出现，以及“先收割、后解密”（HNDL）威胁的活跃，迁移到抗量子密码（PQC）迫在眉睫。论文评估了NIST FIPS 204/205/206签名标准（ML-DSA、SLH-DSA/SPHINCS+、Falcon）在NPP基础设施中的性能，联合建模了M/M/c队列饱和度、广义极值（GEV）尾部边界和HNDL精算暴露。模拟覆盖1000个季节性混合的模拟天（8000万事件），并在七节点多云测试床上使用liboqs 0.15.0跨四种微架构（Intel Xeon Ice Lake/Cascade Lake、AMD EPYC Milan、ARM Graviton3）进行跨平台验证。结果显示，ML-DSA和Falcon在所有配置下均达到100% SLA合规；最坏情况下NPP的p99开销为1.57毫秒（ML-DSA-87，占SLA预算的0.079%）。论文引入了加密稀释指数（CDI = delta-p99/p99_e2e），显示所有非SPHINCS+算法的CDI < 0.04。GEV分析得出p99.9边界低于154毫秒（95%置信区间）。Falcon-512是唯一适合SWIFT MT字段限制（2048字节，组合后1563字节）的NIST PQC签名。SPHINCS+在NPP流量下会导致HSM队列饱和（rho=1.8855，c=2服务器），达到0% NPP SLA合规，被描述为混合部署中的DoS放大面（利用率比约9428倍ECDSA）。HNDL精算模型估计到2030年将有95.6亿条NPP记录面临风险。迁移成本在2026年达到峰值2140万美元，到2028年降至每年150万美元。论文为支付基础设施的PQC迁移提供了详细的性能基准和成本分析，适合基础设施架构师、风险管理者和安全研究者阅读。

💡 推荐理由: 该研究首次针对高频实时支付系统进行PQC签名方案的性能建模，揭示了SPHINCS+在现有SLA下不可行的严重问题，并提出了CDI指标用于量化加密开销影响，对金融基础设施的量子安全迁移具有直接指导意义。

🎯 建议动作: 建议支付基础设施架构师评估ML-DSA或Falcon的集成方案，避免SPHINCS+，并参考迁移成本模型制定预算。

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

Cyber Security Daily Radar

#cs.PF

Implementation and Optimization of HQC Decoding on NPU-Integrated Devices

Causal Unlearning in Collaborative Optimization: Exact and Approximate Influence Reversal under Adversarial Contributions

Protection Is (Nearly) All You Need: Structural Protection Dominates Scoring in Globally Capped KV Eviction

Key Encapsulation Mechanism-Based Integrated Encryption Scheme (KEM-IES)

Post-Quantum Cryptography Migration in Australian Real-Time Payment Infrastructure: A Monte Carlo Simulation Study of the New Payments Platform