#tpu

共收录 1 条相关安全情报。

← 返回所有主题
👥 作者: Shruthi Gorantala, Jianming Tong, Asra Ali, Baiyu Li, Jonathan Katz, Jeremy Kun, Thomas Steinke, Abhradeep Thakurta, Julian Walker, Amir Yazdanbakhsh

全同态加密(FHE)在规模化部署中面临巨大的计算开销。虽然专用硬件加速器(如Google TPU)可以提供帮助,但将复杂的密码学内核映射到此类架构上仍然具有挑战性。高效执行需要对基于脉动阵列的矩阵乘法单元(MXU)和向量处理单元(VPU)进行协同优化,并精心协调向量寄存器文件间的数据移动。现有编译器栈往往抽象了底层硬件利用率,迫使开发者采用手动试错过程,导致执行碎片化和资源未充分利用。为了加速这一开发过程,本文使用AlphaEvolve来自动探索硬件感知的密码学内核优化。作者将优化问题形式化为一个进化搜索问题,利用AlphaEvolve提供的闭环系统,该系统结合了LLM驱动的代码生成。他们利用来自硬件执行的真实反馈和严格的正确性测试来指导进化过程。在Google Cloud TPUv5e上,针对TFHE(Jaxite)和CKKS(CROSS)两种FHE方案的原语进行评估,AlphaEvolve在24小时的自动探索中,发现了实现级别的优化,使TFHE引导程序延迟相比人工设计的最先进方案提升了2.5倍,CKKS旋转和乘法延迟分别提升了1.31倍和1.18倍。这些结果表明,AlphaEvolve能够帮助研究人员在密码学、编译器和硬件加速器之间进行优化权衡。

💡 推荐理由: 该研究展示了LLM驱动的自动优化方法在密码学加速领域的潜力,为FHE部署效率提升提供了新思路,值得关注同态加密和硬件加速交叉领域的研究者与工程师。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)