[发明专利]一种基于多音素选择的唇型伪造视频检测方法及系统有效

专利信息
申请号: 202110076775.7 申请日: 2021-01-20
公开(公告)号: CN112766166B 公开(公告)日: 2022-09-06
发明(设计)人: 周文柏;张卫明;俞能海;林佳滢;刘泓谷 申请(专利权)人: 中国科学技术大学
主分类号: G06V20/40 分类号: G06V20/40;G06V40/20;G06V40/16;G06V10/764;G06V10/80;G06K9/62
代理公司: 北京科迪生专利代理有限责任公司 11251 代理人: 江亚平
地址: 230026 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 多音 选择 伪造 视频 检测 方法 系统
【说明书】:

发明涉及一种基于多音素选择的唇型伪造视频检测方法及系统,其方法包括:步骤S1:建立音素和唇形的映射,得到音素类别集;步骤S2:根据不同唇型篡改方法,从音素类别中,选择对应的多音素类别子集,并根据预设唇形帧个数,构建至少一个音素唇形数据集作为训练样本集合;步骤S3:根据至少一个音素唇形数据集,构建对应的至少一个唇型伪造视频检测子模型,分别训练,得到对应的至少一个唇型检测结果;步骤S4:将至少一个唇型检测结果进行融合,得到融合唇型检测结果。本发明方法建立了音素‑唇形映射关系,并选择音素‑唇形子集训练子模型并融合结果。本发明方法可以区分不同篡改方法,并建立了一个新数据集,有利于后续唇形篡改检测工作发展。

技术领域

本发明涉及人脸伪造deepfake、人脸伪造检测以及视听语音识别领域,特别涉及基 于多音素的人脸唇形篡改视频检测方法及系统。

背景技术

由于深度生成模型(generative models)的巨大成功,人脸伪造deepfake成为近年 来一个新兴的研究课题,根据篡改区域的不同,人脸伪造方法大致可以分为两类:1.全脸合成(Full-face synthesis),通常会将整个合成的人脸替换到目标人脸;2.局部区域篡改(Local region forgery),只修改人脸局部区域,例如篡改唇形来匹配音频内容,并达到视觉上的同步(lip forgery)。

全脸合成的典型方法有DeepFakes、FaceSwap、FSGAN和FaceShifter等,其中FaceShifter可以产生高保真和遮挡感知的结果。这类方法通常会“改变身份”,因此 需要篡改一个大的面部区域,有可能出现范围更广的伪影artifacts。

局部区域篡改作为一种更常见的人脸伪造方法,着重于轻微篡改人脸的部分区域, 例如眉毛和唇形,相关方法包括Face2Face、First Order Motion和Neural VoicePuppetry 等。作为开创性工作,Lip sync能够修改讲话视频中的唇形,使其与给定的音频序列精 确同步。Audio driven对人脸视频进行3D建模,更加灵活的控制唇形生成。最近,First Order Motion输入一段动态视频和一张静态人脸图像,动态视频作为驱动篡改静态人脸 的唇形,生成该静态人脸的说话视频。

随着大量伪造视频越来越逼真甚至能轻易欺骗人眼,给社会带来了潜在的安全威胁。 为了遏制恶意使用deepfake带来的风险,许多检测方法分别从空域、时域和频域考虑,在一些公共数据集上取得了显著的检测效果。然而,这些数据集中大部分deepfake视频 都是通过全脸合成进行篡改,导致绝大多数检测方法采取通用方式设计,从整个人脸区 域提取视觉特征,并没有考虑音频匹配的情况。尽管它们在检测全脸合成方面表现很好, 但在检测局部人脸区域伪造时却遇到很大挑战,例如检测唇形篡改Lip sync。这类篡改 中具有区分性的缺陷通常是局部且微小的,难以被通用的deepfake检测框架捕捉。

最近,Komal Chugh等利用了音频特征,通过检测听觉和视觉信息的同步性来鉴别伪造视频。但由于唇形与具体单词并不遵循严格的相关性,网络会混淆而产生误判。Agarwal等则尝试通过音素-视素匹配(phoneme-viseme matching)来检测唇形篡改Lipsync。在单音素下判断唇形张开、闭合的异常来检测唇形是否被篡改,场景有很大的限 制,只对特定的目标人物有效。

因此,如何能快速有效地检测唇形篡改视频成为一个亟待解决的问题。

发明内容

为了解决上述技术问题,本发明提供一种基于多音素选择的唇型伪造视频检测方法 及系统。

本发明技术解决方案为:一种基于多音素选择的唇型伪造视频检测方法,包括:

步骤S1:建立音素和唇形的映射,得到音素类别集;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110076775.7/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top