#secure-code-generation 主题 - Cyber Security Daily Radar

👥 作者: Xiaoyun Xu, Lichao Wu, Jona te Lintelo, Siyu Zhang, Stjepan Picek

大型语言模型（LLM）在生成代码时频繁引入可利用的安全缺陷。现有防御方法通常依赖繁重的微调或外部知识检索，带来显著的计算开销和冗余代码示例导致的数据偏差。本文提出一种相反观点：预训练语料库中已包含丰富的安全知识，缺陷在于激活不足——缺乏明确、简洁的提示时，模型倾向于遵循训练分布中的常见模式，抑制了安全相关表征。为此，作者提出 SPARK，一个无需重新训练的推理时安全皮套，包含两个组件：组件 I 为每个编码任务检索相关的通用弱点枚举（CWE）条目，并将简短的结构化提示附加到 prompt 中，仅此即可激活模型已有的安全表征；组件 II 在每一步解码时向 logits 添加预计算的 token 偏置——该偏置通过对安全方向向量（平均安全隐藏状态与平均不安全隐藏状态之差）投影到语言模型头部获得，离线计算一次，推理时每生成一个 token 仅需一次向量加法。SPARK 在 C++、Java 和 Python 上对 9 个开源模型进行评测，与 7 个基线（包括微调和检索增强方法）对比，在所有设置中匹配或超越最佳基线，同时保持 HumanEval 代码功能正确性。此外，还在黑盒环境下对 7 个最强闭源模型（包括 Claude、DeepSeek 和 GPT）测试组件 I，证实了不安全代码生成的瓶颈以及本方法带来的改进。该工作表明，通过轻量级推理时干预激活 LLM 内生的安全知识，可以高效提升代码安全性，为安全代码生成提供了新范式。

💡 推荐理由: 本工作揭示了LLM安全代码生成的核心瓶颈在于知识激活而非知识缺失，提出的轻量推理时方法无需重训练即可显著提升代码安全性，对安全开发流程和LLM安全研究具有重要启发。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.6)

#secure-code-generation

SPARK: Security Knowledge Priming and Representation-Guided Knowledge Activation for LLM-based Secure Code Generation