#large language models 主题 - Cyber Security Daily Radar

👥 作者: Javier Pallarés de Bonrostro, Ana I. González-Tablas, María Isabel González Vasco

本研究针对后量子密码学（PQC）迁移过程中代码级重构的挑战，评估了大型语言模型（LLM）在将传统密码学代码片段迁移至PQC对应实现时的能力。现有PQC迁移框架主要提供组织层面的指导，但实际代码修复仍依赖人工且易出错。为此，作者构建了一个可复现的实验框架，包含800对Python代码片段的合成数据集，覆盖六种密码学家族及组合多原语场景。每对代码通过类别特定的功能测试进行验证，以确保数据集质量并客观评估模型生成的迁移结果。评估了四种模型：零样本设置的GPT-4.1，以及微调版本的GPT-3.5-turbo、GPT-4.1-mini和CodeLlama-7B-Instruct。结果显示，领域特定的微调对于可靠的密码学迁移至关重要。微调后的GPT-4.1-mini模型表现最佳，平均静态相似度达到0.9072，动态功能正确率高达92.5%，大幅超越零样本基线。在六个开源代码库上的补充验证表明，该方法能够在局部密码学模块中产生有用的迁移，但在存在复杂依赖和跨模块交互的大型项目中仍存在局限。这些发现表明，若结合自动化验证和依赖感知的验证，微调后的LLM可以作为未来密码敏捷迁移流水线中的实用组件。

💡 推荐理由: 该研究首次系统评估了LLM在PQC代码迁移中的实用性，为自动化迁移工具的开发提供了基准和方法论，对应对量子计算威胁有重要参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

#large language models

Empirical Evaluation of Large Language Models for Migration of Code Fragments to Post-Quantum Cryptography