该论文探索了大型语言模型(LLM)在对称密码分析中神经区分器任务上的应用。神经区分器是一种通过机器学习模型区分密文对来恢复密钥的方法,以往工作多使用ResNet等传统深度学习模型,但尚未有研究将LLM用于此任务。作者提出了一种基于LLM的神经区分器方法,通过设计prompt将明文-密文对输入LLM,并针对SPECK-32/64轻量级密码进行了大量实验。实验发现三个关键结果:第一,与现有ResNet结果相比,LLM并未带来可观测的性能提升,甚至在某些指标上略差;第二,随着加密轮数增加,差分选择对LLM和ResNet的效果均急剧下降,表明高轮数下差分特征丧失;第三,将简单的XOR运算结果作为prompt的一部分输入LLM,可以显著提升区分能力,这暗示LLM可能更擅长利用直接计算得出的特征而非原始数据。该研究为LLM在密码学应用中的潜力提供了初步评估,尽管当前LLM未能超越专用模型,但prompt设计的优化方向值得关注。适合密码学研究人员、AI安全交叉领域从业者以及对称密码分析开发者阅读。
💡 推荐理由: 首次系统评估LLM在对称密码神经区分器中的表现,揭示了LLM目前无法提升传统方法性能,但潜在提示工程方向值得关注。
🎯 建议动作: 研究跟进