#code-language-model

共收录 2 条相关安全情报。

← 返回所有主题
👥 作者: Yuchen Chen, Weisong Sun, Haocheng Huang, Yuan Xiao, Chunrong Fang, Yiran Zhang, Tingting Xu, Zhenpeng Chen, An Guo, Peizhuo Lv, Xiaofang Zhang, Zhenyu Chen, Yang Liu, Baowen Xu

本文针对代码语言模型(CodeLMs)中的自然后门漏洞进行了深入的实证研究。自然后门是指模型在正常训练过程中无意习得的后门行为,与通过数据投毒注入的后门不同,其产生机制与模型内部表征有关。研究覆盖了多种模型架构(如GPT、BERT变体)和代码智能任务(如代码补全、缺陷检测、代码翻译),在44个场景下系统性地评估了自然后门的存在性,结果表明自然后门在CodeLMs中普遍且固有。作者从模型层面和参数层面揭示了自然后门与注入后门的差异:前者往往与更多参数相关且分布更散。进一步分析了自然后门在数据集、模型架构和共享知识上的可迁移性,发现它们能在不同任务间迁移。成因分析从训练数据(如数据中的隐性偏差)和训练过程(如过拟合)两方面展开。评估了现有防御技术(包括预训练、训练中、训练后防御)对自然后门的缓解效果,发现多数防御效果有限。最后提出了ScanNBT检测方法,通过特征分析和异常模式识别来增强对自然后门的检测能力。该研究有助于理解CodeLMs的安全隐患,为开发更安全的代码模型提供指导。适合安全研究人员、AI安全工程师、代码智能开发者阅读。

💡 推荐理由: 自然后门可能潜伏在正常训练的代码模型中,影响代码生成、漏洞检测等关键任务的安全性与可靠性,现有防御手段难以有效清除,对依赖CodeLMs的软件供应链构成潜在威胁。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Nils Loose, Joseph Bienhüls, Kristoffer Hempel, Felix Mächtle, Thomas Eisenbarth

本研究针对漏洞修复提交(VFC)的自动化检测问题进行了系统性的实证评估。背景是:安全补丁部署的及时性至关重要,但官方漏洞建议库(advisory databases)平均比补丁发布延迟25天,且许多修复从未被收录为建议。当前该领域存在超过20个分散的数据集和评估方法,缺乏统一基准。本文构建了一个统一框架,整合了超过18万个提交,对基于代码语言模型的VFC检测进行了大规模实验(180余次),模型参数规模从1.25亿到140亿不等。关键发现包括:(1)仅凭代码变更,模型未能习得可迁移的安全相关代码理解能力;(2)当提交消息(commit messages)可用时,模型注意力几乎完全集中于此,而非代码变更本身;(3)移除提交消息后,即使通过过程内语义上下文丰富diff,注意力分析仍显示模型关注点未转向代码变更;(4)按项目分组的分层评估显示性能比随机分割下降约17%;(5)在聚合数据集上进行时间分割因底层项目分布的组合偏移而不可靠;(6)在0.5%的假阳性率下,所有微调后的纯代码模型漏检超过93%的漏洞。更大规模、更多样化的训练数据或生成式方法虽有初步改进,但未能解决根本局限。作者公开了统一框架和评估套件以支持未来研究。

💡 推荐理由: 该研究通过大规模严格实验,揭示了当前基于代码的漏洞修复提交检测方法的核心瓶颈:模型无法从代码变更中习得可迁移的安全语义,且高度依赖提交消息。这对安全运营团队依赖自动化工具识别补丁提出了警示,强调了融合多种信息源的必要性。

🎯 建议动作: 研究跟进

排序因子: 有可用补丁/修复方案 (+3) | 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)