#malware-detection

共收录 13 条相关安全情报。

← 返回所有主题
👥 作者: Fatima Qaiser, Bisma Tahir, Muhammad Abid Mughal, Nauman Shamim

恶意软件检测是网络安全的核心挑战之一。传统基于静态特征(如签名、熵)的方法容易受到加壳(packing)技术的干扰,而基于可视化的方法将二进制字节映射为灰度图像,利用视觉分类器进行检测,具有抗规避和无需反汇编的优势。然而,可执行文件加壳会生成高熵图像,破坏模型依赖的结构模式,且加壳在良性软件中也普遍存在(如压缩或版权保护),因此仅靠加壳状态无法可靠区分恶意性。现有方法未能在统一的监督框架下解决这一问题。为此,本文提出 ViPER(Vision-based Packing-Aware Encoder for Robust Malware Detection),一种基于视觉的、具有打包感知能力的鲁棒恶意软件检测模型。ViPER 采用 LoRA 微调的 ViT-B/14 骨干网络,并设计双头架构,同时学习恶意软件分类和打包检测任务。打包感知门控机制根据推断的打包状态调节恶意软件分类的决策边界,从而对加壳和未加壳样本采用不同的决策规则。针对训练中打包标签分布不均的问题,使用频率加权损失和联合类-打包层的分层采样。实验在 200,000 张 Windows PE 字节图图像上进行,ViPER 的平衡准确率达到 0.8521,ROC-AUC 为 0.9260,AUPR 为 0.9279,在所有主要指标上均优于现有基线,且打包检测 AUC 达到 0.9949。该研究表明,显式建模打包状态能够显著提升基于视觉的恶意软件检测的鲁棒性。

💡 推荐理由: 恶意软件加壳是实际攻防中常见的规避手段,该工作通过显式建模打包状态,提升了基于视觉的检测器在加壳场景下的鲁棒性,为安全运营中自动化恶意样本分诊提供了新思路。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Jianwen Tian, Wei Kong, Debin Gao, Tong Wang, Taotao Gu, Kefan Qiu, Zhi Wang 0014, Xiaohui Kuang

本文针对AI驱动的恶意软件检测器面临的多种挑战(包括投毒攻击、逃避攻击和概念漂移)提出了一种统一的解决方案。作者指出这些挑战的一个根本原因是数据稀疏性,即某些特征值在数据集中出现的频率极低。为解决稀疏性问题,论文设计了新的压缩技术来缓解稀疏性,并提出了一种密度提升训练方法来持续填充稀疏区域。该方法被应用于PE、Android和PDF恶意软件数据集(如EMBER、SOREL-20M、DREBIN和Contagio)进行实验。结果表明,该方法不仅增强了模型对抗各种攻击的鲁棒性,还提升了检测性能和时间可持续性。例如,在EMBER数据集上,后门攻击成功率从99.99%降至23.71%,F1分数从99.301%升至99.488%;在SOREL-20M数据集上,可持续性指标AUT从92.850%提升至95.135%。该方法与现有防御技术互补,并在多个数据集上验证了其一致性。

💡 推荐理由: 本文提供了一种同时提升恶意软件检测器性能、鲁棒性和可持续性的统一策略,解决了当前防御方案孤立处理问题的局限,对提升实际安全系统的防御能力有重要参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Tadiwa Vhito, Jakapan Suaboot, Warodom Werapun, Norrathep Rattanavipanon

本文提出一个名为FDM(决策框架)的框架,用于构建基于机器学习的恶意软件检测系统。选择机器学习配置是一个多准则优化问题,需要考虑模型选择、特征工程、更新机制等多种因素,且不同部署场景的约束各异。FDM通过加权配置兼容性得分(WCCS)将五个操作参数(平台约束、资源预算、响应延迟、更新频率、检测灵敏度)映射到九个配置维度的排序推荐,从而形式化选择过程。为了验证框架,作者在三个数据集上进行了四个实验:私有Windows API数据集、公开Malimg图像基准和Android静态API数据集。关键结果包括:(i) 在二分类中,XGBoost实现了最佳准确率与资源比(测试准确率97.46%,内存<70MB),优于LSTM/BiLSTM(消耗高达2.8GB);(ii) 多分类中,经典模型(XGBoost 79.03%)优于循环深度模型(BiLSTM 72.27%),与二分类结果相反;(iii) 使用EfficientNetB0的类增量学习在11个增量步骤中保持了99.13%的准确率,仅下降0.65个百分点;(iv) 迁移学习使图像型恶意软件数据训练时间平均减少2.14倍,且准确率无显著损失;(v) 自编码器预处理实现了14倍的训练加速,仅损失0.86个百分点的准确率。这些发现证实最佳ML配置依赖于上下文,验证了FDM的核心前提,并展示了其对安全从业者的实用价值。

💡 推荐理由: 该框架为安全团队提供了一种系统化的决策方法,用于在不同部署场景下选择最优的ML配置,减少试错成本,提升恶意软件检测系统的效能。

🎯 建议动作: 纳入内部评估

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Parthajit Borah, Sakshi Singh, D. K. Bhattacharyya, J. K. Kalita

恶意软件检测是网络安全领域的关键挑战,因为恶意软件具有复杂结构和行为。现有的检测方法中,通过函数调用图(FCG)分析恶意软件的结构和行为模式是一种可靠的方法,但缺乏足够大且高质量的数据集来支撑对众多恶意软件家族的有效分类。本文提出了AMD-FCG,一个增强的函数调用图数据集,其中集成了恶意软件的拓扑特征。该数据集包含多种恶意软件样本和良性应用程序的FCG,旨在为安全专业人员提供无需动态分析和大量预处理的高效检测流程。AMD-FCG框架简化了工作流程,可支持开发和部署更创新、高效的恶意软件检测系统。实验部分(根据摘要推断)可能验证了数据集在分类准确性和鲁棒性上的优势。该研究贡献了一个标准化基准数据集,有助于推动基于图的恶意软件检测研究。

💡 推荐理由: 为恶意软件检测研究提供了高质量、带拓扑特征的函数调用图数据集,填补了现有公共数据集不足,有助于开发和评估基于图神经网络的检测模型,提升安全分析效率。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
推荐 3.5
Conf: 50%
👥 作者: Akash Amalan, Georgios Smaragdakis, Tom J. Viering

恶意软件检测目前仍然主要依赖于被动反应:机器学习模型在已知样本上训练,但随着威胁演化,模型性能会下降。理解恶意软件家族之间的进化关系可以促进主动防御,但传统的逆向工程可能需要数月甚至数年才能揭示这种谱系关系。本文提出 MalTree 框架,该框架受生物信息学启发,大规模应用系统发育技术(UPGMA 和 Neighbor-Joining),利用结构、行为和图像特征自动建模恶意软件进化。作者引入了基于 VirusTotal 时间戳的时间验证,以评估推断出的进化树是否反映真实的出现顺序。MalTree 达到了 87% 的时间一致性,表明推断的进化关系与真实世界的时间线高度吻合。分析显示,某些家族的变异速度比其他家族快 10 倍以上,这表明检测策略应根据家族特定的进化速度进行定制。案例研究(包括 Mirai 僵尸网络)证实,从系统发育树推断出的关系与已有威胁情报记录一致。该框架为将恶意软件分析从基于样本的分类转向谱系感知的进化建模奠定了基础。

💡 推荐理由: 提出了一种全新的恶意软件家族进化关系自动推断方法,使防御者能够从时间维度理解威胁演变,针对变异速度快的家族提前调整检测策略,实现从被动响应到主动预测的转变。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Emmanuele Massidda, Diego Soi, Giorgio Giacinto

该论文提出了一种从设计上保护隐私的Android恶意软件检测流水线。现有检测方法普遍需要收集设备标识符、网络痕迹、运行时数据等敏感用户信息,尽管后续可采用匿名化、加密或联邦学习等技术保护隐私,但仍然要求用户高度信任拥有特权访问权限的系统。作者认为,这种信任依赖应该被消除而非管理。论文首先形式化了一套隐私设计(privacy-by-design)的检测需求,然后逐一实现。流水线首先执行静态分析,从APK中提取特征(遵循Drebin表示),经向量化后送入SVM分类器。分类器配备双拒绝阈值规则:若置信度足够则直接输出决策,否则将样本推迟到沙箱环境的动态分析阶段。这样,真实的用户信息永远不会进入分析循环。实验使用2024至2025年的时间序列分割数据集,结果表明:仅靠第一阶段静态分析即可达到0.87的F1分数,仅6.7%的测试样本需要进入第二阶段的动态分析。动态沙箱分析在不提取任何敏感数据的情况下,也能高置信度地识别恶意软件。这些结果证明,在不牺牲用户隐私的前提下,可以实现强劲的检测性能。该研究适合关注隐私保护、移动安全、以及对抗隐私与性能权衡的安全研究人员阅读。

💡 推荐理由: 该研究首次将隐私设计原则系统性地融入Android恶意检测全过程,在不损失检测精度的前提下彻底避免收集用户敏感数据,为隐私合规提供了可行的技术路径,且对监管日益严格的环境尤其重要。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Biagio Montaruli, Andrea Oliveri, Savino Dambra, Davide Balzarotti

尽管 macOS 在个人用户和企业系统中的普及度日益增长,但恶意软件研究长期聚焦于 Windows 和 Android,针对 macOS 的检测工作相对不足。操作系统自身的特异性以及 Mach-O 文件格式的独特结构,在未知样本分类中可发挥关键作用。本文首次在文献中提出利用 macOS 二进制文件的领域特定静态特征——包括嵌入式证书、权限(entitlements)、持久化技术及关键系统 API——来训练机器学习恶意软件检测器。研究者构建了一个包含 41,129 个样本(11,413 良性、29,716 恶意)的新数据集,并通过综合实验证明,所提方案达到了 98.50% 的检测率,平均比现有最优方法提升 16%,且经过特征重要性分析确认领域特定特征贡献显著。为进一步评估检测器的时间泛化能力,研究者使用 9,000 个全新 macOS 可执行文件进行真实环境测试,结果显示检测率高达 99.50%,相比当前最优方法提升 50%;当移除领域特定特征时,检测性能下降 15.92%,证实了这些特征对泛化到新型恶意样本至关重要。最后,作者将数据集公开给研究社区。该工作为 macOS 恶意软件检测提供了全新的特征视角,对安全社区具有重要参考价值。

💡 推荐理由: macOS 安全研究长期滞后,该工作首次系统引入 Mach-O 领域特定特征,显著提升了检测率与泛化能力,为蓝队和 macOS 安全产品提供了切实可行的特征工程思路。

🎯 建议动作: 研究跟进,评估将文中特征集纳入内部 macOS 安全检测管道的可行性与效果。

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Suresh Kumar Amalapuram, Bikraj Shresta, Siva Ram murthy Chebiyam, Bheemarjuna Reddy Tamma, Sumohana S Channappayya

该论文针对基于机器学习的恶意软件检测器因概念漂移(即良性软件和恶意软件随时间演变导致检测模型过时)而性能下降的问题,提出了一种名为 SEED 的半监督持续恶意软件检测方法。现有方法(如使用层次对比损失 HCL 结合主动学习)依赖大量标注数据,但在安全领域获取标注数据困难且成本高昂。当仅有部分标注数据时,HCL 在检测未知恶意软件时性能显著下降,尤其是在缺乏强语义结构的 BODMAS 数据集上。SEED 通过结合定制的二元交叉熵目标、半监督持续学习和主动学习,在有限监督下实现有效检测。对于部分标注的已知任务,利用奇异值分解从先前数据构建表示空间,将未标注样本投影到该空间并与合适标注样本配对,以鼓励表示一致性。对于完全无标注的未知任务,在表示空间中利用余弦距离量化不确定性,选择最不确定的样本供分析师标注。在 Windows(BODMAS)和 Android(AndroZoo、APIGraph)数据集上的实验表明,仅使用20%的标注数据,SEED 在未知恶意软件检测的平均AUT(AUC曲线下面积随时间变化)相比半监督HCL*提高了40%(BODMAS)和14%(AndroZoo),在APIGraph上也具有竞争力。此外,SEED 引入延迟缓冲区更新策略以减少重放过程中的标签噪声传播,提高学习稳定性。该研究适合网络安全研究人员、恶意软件检测工程师以及关注持续学习和半监督学习在安全领域应用的从业者阅读。

💡 推荐理由: 解决了恶意软件检测中标注数据稀缺和概念漂移双重挑战,显著提升少量标注下的未知恶意软件检测性能,降低人工标注成本。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Ahmed Sabbah, Mohammed Kharma, Radi Jarrar, Samer Zein, David Mohaisen

本文研究了在时间概念漂移背景下,Android恶意软件检测模型的对抗鲁棒性如何随时间演变。研究团队收集了跨越十多年的Android应用数据集,从模拟器和真实设备执行中提取静态和动态特征表示,并将数据按年份切片。他们设计了三种部署协议模拟真实世界的学习场景:(1) 同年训练和测试;(2) 跨年部署但不更新模型;(3) 扩展窗口重训练,利用累积的历史数据。在多种分类器家族上,使用FGSM和SPSA在可行性约束下生成对抗样本。实验测量了干净性能、对抗准确率(AA)、攻击成功率(ASR),并引入了三个时间链接指标——RobustDrop、ΔASR和对抗放大因子(AAF)——来量化分布偏移与鲁棒性退化之间的关系。结果表明,时间分离会降低基于特征迁移的对抗鲁棒性。随着训练-测试时间差距增大,干净准确率和对抗准确率均下降,而攻击成功率在某些配置下(特别是FGSM扰动和静态特征下)增加。扩展窗口重训练可以缓解但不能完全消除在持续分布演化下的鲁棒性损失。这些发现表明,在评估智能检测系统在演化数据分布下的长期鲁棒性时,应考虑时间漂移,并突出了在长期对抗环境中建立漂移感知鲁棒性评估框架的必要性。

💡 推荐理由: 首次系统量化了时间概念漂移对Android恶意软件检测对抗鲁棒性的影响,为长期部署的检测系统提供了关键的鲁棒性评估视角。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
推荐 3.5
Conf: 50%
👥 作者: Jan Dolejš, Martin Jureček, Róbert Lórencz

本文研究了针对现代恶意软件检测管道的灰盒投毒攻击模型。现代检测系统通常依赖持续数据摄入和机器学习来应对大量新型威胁。作者利用secml_malware框架,通过功能保留的操纵(具体为导入地址表IAT和节注入)生成问题空间对抗性二进制样本。他们评估了这些投毒样本被摄入到基于LightGBM的恶意软件检测模型训练集时的影响。实验结果表明,基于IAT的微妙扰动能够生成紧凑的投毒样本,显著降低检测召回率。这些发现揭示了在连续学习系统中开发低可视性对抗扰动同时保持高投毒效能的固有挑战。此外,作者评估了一种基于同质集成的防御机制,该机制能够成功识别并过滤高达95.6%的投毒尝试,同时保持对合法数据的高保留率。该工作强调了在生产管道中进行鲁棒的摄入前验证的必要性。本文适合安全工程师、对抗性机器学习研究人员以及恶意软件检测系统的开发人员阅读。

💡 推荐理由: 揭示了现代恶意软件检测管道在持续学习场景下面临的灰盒投毒威胁,并提出了实用的基于集成的防御方法,对保障检测系统鲁棒性具有重要意义。

🎯 建议动作: 研究跟进:将同质集成防御机制纳入内部恶意软件检测管道的预验证阶段。

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Ping He, Yifan Xia, Xuhong Zhang 0002, Shouling Ji

本文针对基于机器学习的Android恶意软件检测(AMD)方法,提出了一种名为AdvDroidZero的高效查询式攻击框架。当前对该类方法的对抗样本攻击大多依赖较强假设,如攻击者知晓特征空间、模型参数或训练数据集等知识,这在现实攻击场景中往往不成立。AdvDroidZero在零知识设置下运作,即攻击者无需提前了解目标模型的内部细节,仅通过黑盒查询即可生成对抗样本。该框架通过设计高效的查询策略和针对性扰动生成方法,显著降低了攻击所需的查询次数,同时保持了高攻击成功率。在多个主流基于机器学习的AMD方法(包括最新技术)以及真实世界反病毒产品上的广泛评估表明,AdvDroidZero能够有效规避检测,揭示了当前检测方法的脆弱性。论文分析了攻击成本与效果,并讨论了可能的防御方向。本研究对安全社区理解对抗性机器学习威胁具有重要意义,尤其针对移动安全领域的现实攻击场景。

💡 推荐理由: 该攻击在零知识条件下(更贴近真实攻击者能力)仍能高效绕过主流ML检测和真实反病毒产品,迫使安全团队重新评估现有Android恶意软件检测方案的稳健性。

🎯 建议动作: 研究跟进

排序因子: 影响边界/网络设备 (+5) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Sk Tanzir Mehedi, Raja Jurdak, Chadni Islam, Abu Bakar Siddique Mahi, Gowri Ramachandran

eDySec 是一个基于深度学习的动态行为分析框架,旨在检测 PyPI 生态系统中的恶意包。随着下一代软件供应链攻击(如多阶段恶意软件执行、远程访问激活和动态载荷生成)的兴起,传统机器学习检测器因动态行为数据的高维稀疏性(包括系统调用、网络流量、目录访问模式和依赖日志)而性能下降、稳定性差且缺乏可解释性。本文利用 QUT-DV25 数据集(捕获包安装时和安装后行为)评估多种深度学习模型,并研究特征集以识别最具判别力的属性。框架整合了模型稳定性分析和可解释 AI 技术,提供稳定的透明决策。实验结果表明,eDySec 显著优于现有方法:将特征维度减半,误报率降低 82%,漏报率降低 79%,准确率提升 3%,并达到近乎完美的稳定性,每个包推理延迟仅 170 毫秒。研究还发现特征与模型选择至关重要,某些组合会降低性能。该工作深化了对动态分析应对下一代攻击的优势与局限的理解。

💡 推荐理由: 针对 PyPI 生态中日益复杂的供应链攻击,eDySec 提供了高精度、低延迟且可解释的检测方案,解决了传统 ML 方法在高维稀疏数据下的瓶颈。

🎯 建议动作: 研究跟进,评估该框架在内部环境中的适用性

排序因子: 来自 arXiv 其他板块 (+2) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)

提出一种使用决策树规则集的结构化方法,通过特征重要性、预测一致性等指标量化恶意软件分类中的概念漂移,并在EMBER2024数据集上验证了固定两月窗口和特征级Pearson相关的有效性。

💡 推荐理由: 恶意软件检测模型随时间演化易产生漂移,导致误报漏报;该方法无需标签即可检测漂移,为模型维护和主动更新提供依据,适合安全运维团队用于监测分类器时效性。

🎯 建议动作: 研究跟进

排序因子: Community 数据源 (+1) | LLM 评分加成 (+0.5)