[发明专利]一种虚拟形象的面部驱动方法、装置、设备和介质有效

申请号：	202110534983.7	申请日：	2021-05-17
公开（公告）号：	CN113223125B	公开（公告）日：	2023-09-26
发明（设计）人：	陈超;赵亚飞;张世昌;郭紫垣	申请（专利权）人：	百度在线网络技术（北京）有限公司
主分类号：	G06T13/40	分类号：	G06T13/40;G06T13/20
代理公司：	北京品源专利代理有限公司 11332	代理人：	孟金喆
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种虚拟形象面部驱动方法装置设备介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开提供了一种虚拟形象的面部驱动方法、装置、设备和介质，涉及计算机技术领域，尤其涉及人工智能和深度学习技术领域，所述方法包括：获取目标驱动多媒体信息；形成与目标驱动多媒体信息对应的多个驱动源组；生成与每个驱动源组分别对应的声像融合特征集，并确定与每个声像融合特征集分别对应的面部控制参数；分别使用与各驱动源组对应的面部控制参数，对虚拟形象进行面部驱动。本公开实施例的技术方案可以提高虚拟形象面部驱动结果的准确性。

技术领域

本申请涉及计算机技术领域，尤其涉及人工智能和深度学习技术领域，具体涉及一种虚拟形象的面部驱动方法、装置、设备和介质。

背景技术

在人工智能领域，模拟真人原型的虚拟人物已得到了越来越多的应用，利用真人信息产生的虚拟人物的面部驱动技术，在虚拟客服、虚拟主播等领域可以发挥巨大的价值。

相关技术中通常是基于面捕技术去捕捉真人面部特征，然后重定向到虚拟人物面部以达到驱动效果。

相关技术的主要缺陷在于：通常需要使用面部捕捉专用的头戴式设备，并且需要在真人面部标记关键点，有较强的条件限制；此外，相关技术对唇部运动的捕捉效果不佳，尤其是当真人唇部快速闭合时，相关技术无法驱动虚拟人物达到同样的闭合效果。

发明内容

本公开提供了一种虚拟形象的面部驱动方法、装置、设备和介质。

根据本公开的一方面，提供了一种虚拟形象的面部驱动方法，包括：

获取目标驱动多媒体信息，其中，目标驱动多媒体信息中记录有用于对虚拟形象进行面部驱动的真实人物的声音信息和面部表情信息；

形成与目标驱动多媒体信息对应的多个驱动源组，驱动源组包括：图像帧和与图像帧关联的音频片段；

生成与每个驱动源组分别对应的声像融合特征集，并确定与每个声像融合特征集分别对应的面部控制参数；