本文研究了如何利用近内存处理(Near-Memory Processing, PIM)技术来加速密码学算法(如AES-128和SHA-256),从而减轻传统冯·诺依曼架构中数据移动带来的性能瓶颈。作者指出,尽管这些算法在计算上相对高效,但传统处理器(CPU/GPU)由于内存墙限制,处理大量数据时延迟高、能耗大。PIM通过在内存单元内部或附近执行计算,大幅减少处理器与内存间的数据移动,有望提升加解密性能和能效。现有工作虽已证明PIM在加速密码算法方面的潜力,但缺乏对真实商用PIM系统的全面评估。本文使用UPMEM PIM架构作为实验平台,评估了密码算法在单rank和多rank下的性能。结果表明,在单rank配置下,PIM性能仍低于现代CPU;但当利用所有可用rank进行分布式计算时,PIM能够更有效地加速密码算法,展现出良好的可扩展性。该工作为在真实PIM系统上部署和优化密码学加速提供了重要参考,适合对内存计算、数据安全加速感兴趣的研究者和工程师阅读。
💡 推荐理由: 该研究揭示了将密码学算法卸到内存附近处理的可行性与性能权衡,对构建高吞吐、低延迟的数据安全基础设施具有启发意义。
🎯 建议动作: 研究跟进