#code-generation 主题 - Cyber Security Daily Radar

👥 作者: Jingxuan He, Martin T. Vechev

该论文研究大型语言模型（LLM）在代码生成中的安全问题。随着LLM在大量代码库上训练并用于自动生成代码，它们频繁生成不安全的代码，缺乏安全意识。为此，作者从两个维度展开工作：安全加固（增强LLM生成安全代码的可靠性）和对抗测试（从对抗视角评估LLM的安全性）。核心创新是提出一种名为“受控代码生成”的新安全任务：该任务参数化，输入一个二进制属性，引导LLM生成安全或不安全的代码，同时保持生成功能正确代码的能力。为解决该任务，作者提出一种基于学习的SVEN方法，利用特定于属性的连续向量来引导程序生成朝向给定属性，而不修改LLM的权重。训练过程中，通过在代码的不同区域施加专门的损失项，并使用精心策划的高质量数据集来优化这些连续向量。实验表明，SVEN在实现强安全控制方面非常有效：例如，最先进的CodeGen LM（2.7B参数）在正常条件下生成安全代码的比例为59.1%；应用SVEN进行安全加固后，该比例提升至92.3%；而用于对抗测试时，该比例下降至36.8%。同时，SVEN的功能正确性与原始LLM非常接近。该研究适合安全工程师、AI安全研究员和LLM开发者阅读。

💡 推荐理由: LLM生成的代码安全缺陷日益严重，SVEN提供了一种轻量级、可插拔的安全控制方法，无需微调模型即可有效提升或降低代码安全性，对安全评估和防御部署具有重要参考价值。

🎯 建议动作: 研究跟进

排序因子: 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

#code-generation

Large Language Models for Code: Security Hardening and Adversarial Testing.