#multi-modal

共收录 1 条相关安全情报。

← 返回所有主题
👥 作者: Chidera Biringa, Ajmal Abbas, Vishnu Selvaraj, Gokhan Kul

VulStyle 是一种多模态软件漏洞检测模型,它联合编码函数级源代码、非终端抽象语法树(AST)结构和代码风格特征。以往的代码表示方法主要使用基于词级别的模型或完整的AST树,往往忽略了表明风险编程习惯的风格线索,或者导致较高的结构开销。VulStyle 仅选择非终端AST节点,降低了输入复杂度同时保留了语义层次,并整合了句法和词法级别的代码风格特征作为辅助漏洞信号。该模型使用掩码语言建模在七个编程语言的490万函数上进行预训练,并在五个基准数据集(Devign、BigVul、DiverseVul、REVEAL、VulDeePecker)上进行微调。VulStyle 在BigVul和VulDeePecker上达到了最先进性能,F1分数相比强Transformer基线提升了4%到48%,并在所有基准测试中取得具有竞争力或最佳平均性能。此外,作者进行了消融研究,以单独分析代码风格特征和AST结构的影响,还进行了错误案例分析和在攻击者真实场景下的威胁建模。

💡 推荐理由: VulStyle 创新地将代码风格特征引入漏洞检测,揭示了编程风格可作为漏洞线索,为静态分析提供了新维度,有助于提升检测召回率并减少误报。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)