识别 AI 换脸!百度这项技术夺冠了!
近日,百度在国际计算机视觉大会 ICCV 2021 人脸深度鉴伪比赛中斩获三项第一。国际计算机视觉大会是视觉领域三大顶会之一,这次比赛也极具权威性。最终,百度在图片、视频、视频时序定位三个方向包揽全部冠军,力压国际、国内 177 支参赛队伍,真正秀了一把实力。
百度获得 ICCV 2021 人脸鉴伪比赛全赛道冠军
“眼见”不一定“为实”
日常生活中,深度伪造技术的应用并不少见:智能客服的拟人回答、影视剧对角色的换脸处理、虚拟新闻主播对人力投入的降低······这些应用场景通过对图像、声音、视频的伪造和自动生成,产生高度逼真的效果。
但是,随着技术的发展及应用门槛的降低,深度伪造技术对于个人信息安全、社会安全等的威胁也愈来愈大。越来越多人也能轻松实现“换脸”“变声”, “眼见”不一定“为实”正在我们的生活中不断上演。还有一些人将其应用于人脸识别系统攻击、虚假音视频诈骗等,技术滥用带来的风险逐渐为人们所知。
诸如 Deepfake 等深度伪造技术的滥用对我们究竟意味着什么?如何才能有效“打假”?
只有魔法才能打败魔法!在用 AI 对抗 AI 的过程中,深度鉴伪技术突出重围。
我们做了什么
简单来说,百度这次获奖的比赛,就是让 AI 一眼判断出一张人脸图片是否由算法生成,或面部信息是否被篡改。针对深度鉴伪技术,目前绝大多数研究仍然通过图像分类方法将问题转化为针对单帧图像的多任务判别问题,模型泛化性有限。
在本次竞赛的夺冠方案中,百度视觉团队提出了动态特征队列(DFQ)方案,采用度量学习的方法提升模型泛化性。同时,在空间维度上将图像分成多个局部图像块(如图 1,绿色块代表未被伪造图像区域,红色块代表伪造图像区域),通过计算局部图像块之间的特征分布差异进一步提高模型的泛化能力。
图 1:百度 ICCV2021 人脸深度鉴伪竞赛夺冠方案
针对单帧图像,百度视觉团队首先将局部图像特征分布一致性方案(Patch-Wise Consistency)应用于整张图像,而不仅仅集中于人脸区域。模型提取到的高维特征被用于衡量每两个局部块之间的相似度,并利用这种相似度进行深伪鉴别。
图 2:Dynamic Feature Queue(DFQ)结构示意图
其次,将局部图像特征分布一致性(Patch-Wise Consistency)模型作为预训练模型,基于每帧图像的伪造特征构建一个动态队列。如图 2,通过计算 CNN 网络生成的每个样本特征与动态队列中各个特征之间的距离,将每个 batch 中的伪造特征样本向队列中与其距离最近的伪造特征样本靠近。足够长的队列可以帮助解决灾难性遗忘问题,并充分挖掘困难样本。同时让所有真人样本特征聚集在一个可学习的特征中心,保证真人样本特征在高维特征空间中充分聚集。
开源开放,保障人脸应用安全
目前,百度已通过 AI 开放平台对外提供人脸深度鉴伪接口,准确鉴别 AI 换脸技术和各种黑客工具生成的人脸图像,广泛应用于肖像维权、新闻鉴真等场景,切实保障大众的个人信息安全及互联网内容安全。
接下来,面对深度伪造技术成本低、方式多、人工鉴别难等特点,百度将加强在深度鉴伪算法的泛化性和可解释性,攻防协同和多模态防伪等方面的研究,持续优化针对不同落地场景的差异化能力,保障人脸相关应用的安全。
百度深度鉴伪技术的 AI 开放平台调用接口:
版权声明: 本文为 InfoQ 作者【百度大脑】的原创文章。
原文链接:【http://xie.infoq.cn/article/c37c8e1403e573e965cac2aff】。文章转载请联系作者。
评论