#deepfake-detection

共收录 4 条相关安全情报。

← 返回所有主题
👥 作者: Mohammadreza Rashidi, Raja Hashim Ali, Sami Ur Rahman

该论文针对社交媒体中深度伪造视频检测问题,提出了一种基于3D卷积神经网络(3D CNN)的时序伪影分析方法。研究表明,传统基于单帧的检测器在面对高质量生成器(如128x128 GAN输出)时准确率下降,而时序不一致性伪影仍较稳定。作者采用R3D-18架构的3D CNN,结合二元交叉熵与时间一致性正则化的复合损失函数,在DeepfakeTIMIT数据集上以16帧片段训练,并利用Kinetics-400动作识别权重初始化。实验结果显示,在128x128分辨率下,内数据集评估准确率达92.8%;跨数据集迁移至FaceForensics++(未微调)为76.4%,少量微调后进一步提升。消融研究表明,迁移学习贡献7.2个百分点,人脸跟踪贡献3.5个百分点,而时间一致性正则化在高品质伪造上提供额外增益。结论证明时序伪影比空间伪影更具泛化性,能够抵御社交媒体重编码的干扰。

💡 推荐理由: 社交媒体深度伪造检测是当前安全热点,该研究揭示了时序伪影的鲁棒性,为实际部署提供了更可靠的检测方向。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Mamadou Keita, Wassim Hamidouche, Hessen Bougueffa Eutamene, Abdelmalik Taleb-Ahmed, Xianxun Zhu, Abdenour Hadid

近年来,计算机视觉领域取得了显著进展,尤其是卷积神经网络(CNN)、生成对抗网络(GAN)、扩散模型、视觉变换器(ViT)以及视觉-语言模型(VLM)等架构的发展,使得生成的视觉内容越来越逼真。然而,这些进步也带来了潜在的滥用风险,例如虚假信息、身份盗窃以及隐私和安全威胁。与此同时,基于Mamba的架构作为一种新兴工具,已在图像分类、分割、医学成像、目标检测和图像恢复等多种任务中展现出潜力,但在AI生成图像检测方面的应用尚未被充分探索。本研究对Vision Mamba模型在AI生成图像检测中的性能进行了系统评估和比较分析。我们在多个数据集和合成图像源上,将多种Vision Mamba变体与代表性的CNN、ViT和VLM检测器进行基准测试,重点关注准确性、效率以及跨不同图像类型和生成模型的泛化能力。通过全面分析,我们旨在阐明Vision Mamba相对于现有方法在适用性、准确性和效率方面的优势与局限性。总体而言,我们的研究结果揭示了Vision Mamba作为区分真实与AI生成视觉内容的系统组成部分的潜力与当前局限。这项研究对于在区分真实与AI生成内容成为重大挑战的时代提升检测能力至关重要。

💡 推荐理由: AI生成图像检测是当前网络安全和内容真实性验证的关键技术,Vision Mamba作为一种新架构,其性能评估对蓝队选择检测工具有重要参考价值。

🎯 建议动作: 研究跟进

排序因子: 来自 arXiv 其他板块 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Ahmad Albarqawi, Mahmoud Nazzal, Issa Khalil, Abdallah Khreishah, NhatHai Phan

随着深度伪造技术的快速发展,生成逼真的虚假数字内容对媒体真实性构成严重威胁。传统的深度伪造检测方法在面对定制化、复杂的深度伪造时,泛化能力和鲁棒性往往不足。本文提出了一种名为ViGText的新方法,该方法创新地将图像与视觉大语言模型(VLLM)的文本解释相结合,并基于图神经网络(GNN)框架进行深度伪造检测。ViGText的核心在于利用详细的解释文本而非简单的标题,提供更丰富的上下文信息,从而捕捉细微的不一致性。具体而言,ViGText将图像划分为多个补丁,分别构建图像图和文本图,并通过GNN整合分析。方法还采用了跨空间域和频率域的多级特征提取,以增强对复杂深度伪造的检测鲁棒性。大量实验表明,ViGText在泛化性能上显著提升:在泛化评估中,平均F1分数从72.45%提升至98.32%;面对用户定制化的稳定扩散模型变体时,表现出优异的泛化能力。鲁棒性方面,ViGText的召回率相比其他方法提升了11.1%。针对利用其图架构的定向攻击,ViGText将分类性能下降限制在4%以内。本研究为深度伪造检测设立了新标准,有助于维护媒体真实性和信息完整性。

💡 推荐理由: ViGText结合视觉语言模型与图神经网络,显著提升了深度伪造检测的泛化能力和鲁棒性,为安全团队应对日益复杂的AI生成虚假内容提供了新思路。

🎯 建议动作: 研究跟进,评估将ViGText集成到现有深度伪造检测管道的可行性。

排序因子: 有可用补丁/修复方案 (+3) | 来自网络安全顶级会议 (+8) | 命中热门研究主题 (+2) | Community 数据源 (+1) | LLM 评分加成 (+0.5)
👥 作者: Kavita Kumari, Sasha Behrouzi, Alessandro Pegoraro, Ahmad-Reza Sadeghi

本文提出了一种基于物理反射定律的深度伪造图像检测方法,名为 Light2Lie。当前深度伪造图像生成技术(如 GANs、扩散模型)在保留人脸纹理和几何方面已非常逼真,但往往忽略真实物理环境中光照与物体表面相互作用的固有约束。作者指出,伪造图像中的光照方向、反射强度及阴影分布常存在物理不一致性,而人眼难以察觉。为此,该方法利用双向反射分布函数(BRDF)等物理模型,从单张图像中提取光照特征和反射特征,并通过统计学习或神经网络判断是否符合真实物理规律。具体地,论文设计了一个多尺度特征提取模块,分别计算全局光照一致性(如环境光方向)和局部表面反射属性(如菲涅尔效应)。在多个公开深度伪造数据集(如 FaceForensics++、Celeb-DF)上,该方法在 AUC 和准确率方面显著优于现有的基于频率、纹理或深度学习的检测器,尤其在跨数据集泛化测试中表现鲁棒。此外,作者进行了消融实验,验证了各物理特征分量的贡献。该工作为数字图像取证提供了新思路,表明结合物理先验能有效提升对逼真伪造图像的检测能力。适合研究人员和取证分析师阅读。

💡 推荐理由: 该方法不依赖特定生成模型类型,基于不可伪造的物理规律,对高保真深度伪造具有鲁棒性,有望推动实际取证应用。

🎯 建议动作: 研究跟进

排序因子: 来自网络安全顶级会议 (+8) | Community 数据源 (+1) | LLM 评分加成 (+0.6)