随着人工智能技术的飞速发展,深度伪造(Deepfake)技术应用引发的安全问题日益突出。这项技术已成为网络犯罪的新型工具,显著增加了虚假信息传播、非法取证和网络诈骗的风险。对于企业和个人用户而言,这些高度逼真的伪造图片和视频使得真伪难辨,给信息安全带来严峻挑战。
因此,准确判别图像是否通过生成模型伪造已成为一个关键的安全问题。尽管目前已有多种方法可以检测人工生成的图像并取得了一定效果,但现有技术仍存在两个主要缺陷:
1. 检测方法对特定伪造技术的依赖性强
现有的图像检测技术通常在同一种生成方法(如基于GAN或Diffusion的技术)的数据上训练和测试,效果较好。然而,当面对其他生成方法或未知的伪造技术时,这些检测算法的表现往往不尽如人意。这种局限性可能导致企业在面对新型伪造技术时无法及时有效地识别和应对。
2. 难以识别高级伪造图像
很多检测算法,特别是基于图像特征的传统方法,往往更关注表情、肤色等明显特征,而忽视了更细微的伪造痕迹。这使得区分高质量的伪造图像和真实图像变得困难,增加了误判的可能性,进而影响企业的决策和信息安全管理。
FaceID算法团队推出了一种全新的深度伪造检测技术,该技术基于频域自监督学习(SSL)来检测伪造的图像。
这项技术的核心在于通过分析图像的“频率”信息,即从图像中提取出不同的细节层次,尤其是高频部分(通常代表图像中的细小纹理和边缘信息)。通过这种方式,算法能够更准确地识别出伪造图像中的异常特征,从而提高检测的准确性。
基于频域自监督学习的伪造图像检测方案整体流程
频域自监督学习的检测流程概述:
1) 图像频域滤波:将输入图像分解成两个部分——高频信息和低频信息。高频信息包含图像中的精细细节,如边缘和纹理,而低频信息则包含图像的整体结构。
2) 频域自监督学习:算法通过对大量真实图像的自监督学习,对低频图像进行重建,生成一个包含高频信息的图像副本。这一步的目的是让算法从低频图像中学习如何生成高频细节。
3) 残差计算:算法将最初分离出来的高频图像与重建后的高频图像进行对比,计算出它们的差异。由此得到的频域视觉残差能够揭示伪造图像中隐藏的伪造痕迹。
4) 特征提取:算法将这些残差图像输入到一个卷积神经网络(CNN)中,提取出与伪造相关的特征。这一步帮助算法学习到哪些图像特征可能是伪造的标志。
5) 图像分类:这些特征会被输入到一个分类器中,判断图像是真实的还是伪造的。分类器给出二分类结果:1表示图像是伪造的,0表示图像是真实的。
6) 损失计算和优化:最后,算法会计算分类结果与实际标签之间的误差,并通过这种误差来优化网络,使得未来的检测结果更加精准。
方案优势:有效提升了产品抵御AI深度伪造攻击的准确度和效率
1.新颖框架,单一数据集训练即可获得优异效果
采用将图像从空间域转换到频率域的方法,可以更好地区分真实人脸图像与伪造人脸图像。这种方法的优势在于,它能够在特征空间中更有效地将真实和伪造的人脸分开,从而提高对于AI深度伪造攻击的识别准确度。通过在任一伪造数据集上训练,就能在所有类型的伪造检测中获得很好的效果,这大大提升了检出的效率和适应性。
2. 专注图像高频信息,减少表情肤色等信息干扰
传统的伪造图像检测方法可能会因为图像中的人脸表情或肤色等因素而受到影响。而本方案通过自监督学习专注于高频信息的重建,专注于图像中那些不易察觉的细节,这样就不会被图像中明显的特征所误导,提升了检测的准确度。
随着AI生成内容技术的广泛应用,其带来的潜在风险让人们不得不警醒。但同时,科技界也在不断努力。在未来,旷视将在深伪检测领域继续投入,提供更加有效的检测手段让大家更容易区分真实与虚假内容,守护网络身份安全。

