#secure-code-generation

共收录 1 条相关安全情报。

← 返回所有主题
👥 作者: Xiaoyun Xu, Lichao Wu, Jona te Lintelo, Siyu Zhang, Stjepan Picek

大型语言模型(LLM)在生成代码时频繁引入可利用的安全缺陷。现有防御方法通常依赖繁重的微调或外部知识检索,带来显著的计算开销和冗余代码示例导致的数据偏差。本文提出一种相反观点:预训练语料库中已包含丰富的安全知识,缺陷在于激活不足——缺乏明确、简洁的提示时,模型倾向于遵循训练分布中的常见模式,抑制了安全相关表征。为此,作者提出 SPARK,一个无需重新训练的推理时安全皮套,包含两个组件:组件 I 为每个编码任务检索相关的通用弱点枚举(CWE)条目,并将简短的结构化提示附加到 prompt 中,仅此即可激活模型已有的安全表征;组件 II 在每一步解码时向 logits 添加预计算的 token 偏置——该偏置通过对安全方向向量(平均安全隐藏状态与平均不安全隐藏状态之差)投影到语言模型头部获得,离线计算一次,推理时每生成一个 token 仅需一次向量加法。SPARK 在 C++、Java 和 Python 上对 9 个开源模型进行评测,与 7 个基线(包括微调和检索增强方法)对比,在所有设置中匹配或超越最佳基线,同时保持 HumanEval 代码功能正确性。此外,还在黑盒环境下对 7 个最强闭源模型(包括 Claude、DeepSeek 和 GPT)测试组件 I,证实了不安全代码生成的瓶颈以及本方法带来的改进。该工作表明,通过轻量级推理时干预激活 LLM 内生的安全知识,可以高效提升代码安全性,为安全代码生成提供了新范式。

💡 推荐理由: 本工作揭示了LLM安全代码生成的核心瓶颈在于知识激活而非知识缺失,提出的轻量推理时方法无需重训练即可显著提升代码安全性,对安全开发流程和LLM安全研究具有重要启发。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)