本文针对基于全同态加密(FHE)的隐私保护机器学习推理中存在的计算和内存开销问题展开研究。现有密文打包策略通常仅保持邻近数据元素或特征分组中的一种,导致密文槽利用率低、旋转操作过多、密文数量膨胀,严重制约了推理效率。为此,作者提出了一种统一的、基于片段编码的框架 FEnc²,该框架面向 CKKS 方案,旨在优化卷积神经网络秘密推理中的密文布局。FEnc² 包含两个核心组件:1)卷积感知编码(Conv-aware Encoding),通过分析选择最优的片段大小来解耦空间依赖,并在各层间联合最小化内旋转与外旋转次数;2)架构感知密文压缩(Arch-aware Ct Compression),在特征或通道缩减层后恢复密文密度,减少密文数量。这些变换共同重塑了加密工作负载结构,将同态运算量降低一至两个数量级。在充分利用内存(即最大批处理大小)的条件下,FEnc² 在 MNIST 数据集上的 LeNet 模型上对比现有最优系统 Orion,实现了 GPU 端加速比高达 228.83 倍、CPU 端加速比高达 226.06 倍;在 ImageNet 上的 MobileNet 模型上实现了 GPU 端 4.55 倍、CPU 端 9.43 倍的端到端延迟加速。FEnc² 与硬件无关但具有架构变革性:通过在执行前优化加密张量布局,减少了密文数量和对硬件的计算压力,可补充 NTT 和密钥切换加速器等底层优化。实验表明,应用层的数据布局是加密推理中首要的架构设计维度,也是下一代 FHE 系统的重要使能技术。
💡 推荐理由: 首次从应用层密文数据布局角度大幅优化 FHE 推理性能,突破了传统底层运算优化的天花板,对推动隐私计算实际落地有重要参考价值。
🎯 建议动作: 研究跟进