[发明专利]一种脸部驱动和直播方法、装置、计算机设备和存储介质在审
申请号: | 202110756772.8 | 申请日: | 2021-07-05 |
公开(公告)号: | CN113486787A | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 林哲 | 申请(专利权)人: | 广州虎牙科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08;G06T7/55;G06T15/00;H04N5/265;H04N21/2187;H04N21/234;H04N21/426;H04N21/44;H04N21/4788 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 李彩玲 |
地址: | 511400 广东省广州市番禺*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 脸部 驱动 直播 方法 装置 计算机 设备 存储 介质 | ||
本发明实施例公开了一种脸部驱动和直播方法、装置、计算机设备和存储介质。该方法包括:获取源图像和驱动图像,源图像和驱动图像中包括不同对象的脸部数据;根据在源图像中提取的脸部外观特征,以及在驱动图像中提取的脸部姿态表情特征,合成得到至少一张合成脸部图像;根据各合成脸部图像的脸部特征,以及源图像的背景特征,合成得到目标驱动图像。本发明实施例的技术方案,实现了将源图像与驱动图像进行重组,进而驱动人脸表情在不同人脸模型下的呈现,可以应用于直播等应用场景,解决了现有的人脸驱动训练难度大且质量低的问题。
技术领域
本发明实施例涉及人工智能技术领域,尤其涉及一种脸部驱动和直播方法、装置、计算机设备和存储介质。
背景技术
随着人工智能技术的发展,智能终端广泛应用于学习、娱乐以及工作等多方面。例如,可以通过智能终端进行直播,实现学习、娱乐或者工作等多方面的信息交互。
在直播、虚拟现实以及设计人物表情等相关应用中,可以通过当前人物的人脸驱动另一人物进行同种表情的呈现。
但是,现有技术中在进行人脸驱动时,需要通过视频进行训练,而视频数据中背景在不断变化,造成干扰因素多,致使人脸驱动训练难度大且质量低。
发明内容
本发明实施例提供了一种脸部驱动和直播方法、装置、计算机设备和存储介质,可以降低人脸驱动训练难度并提高人脸驱动质量。
第一方面,本发明实施例提供了一种脸部驱动方法,包括:
获取源图像和驱动图像,源图像和驱动图像中包括不同对象的脸部数据;
根据在源图像中提取的脸部外观特征,以及在驱动图像中提取的脸部姿态表情特征,合成得到至少一张合成脸部图像;
根据各合成脸部图像的脸部特征,以及源图像的背景特征,合成得到目标驱动图像。
第二方面,本发明实施例还提供了一种直播方法,包括:
接收主播客户端上传的直播视频数据,并在所述直播视频数据中提取得到多个直播视频帧,直播视频帧中包括直播用户的脸部数据;
获取主播客户端选定的参考图像,参考图像中包括设定对象的脸部数据;
根据在参考图像中提取的脸部外观特征,以及在各直播视频帧中提取的脸部姿态表情特征,合成得到与各直播视频帧分别对应的至少一张合成脸部图像;
根据与各直播视频帧对应的各合成脸部图像的脸部特征,以及参考图像的背景特征,合成得到与各直播视频帧分别对应的目标驱动图像;
使用各目标驱动图像替换直播视频数据中的各直播视频帧后,在所述主播客户端的直播间中发布所述直播视频数据。
第三方面,本发明实施例还提供了一种脸部驱动装置,包括:
图像获取模块,用于获取源图像和驱动图像,源图像和驱动图像中包括不同对象的脸部数据;
合成脸部图像合成模块,用于根据在源图像中提取的脸部外观特征,以及在驱动图像中提取的脸部姿态表情特征,合成得到至少一张合成脸部图像;
目标驱动图像合成模块,用于根据各合成脸部图像的脸部特征,以及源图像的背景特征,合成得到目标驱动图像。
第四方面,本发明实施例还提供了一种直播装置,包括:
直播视频帧提取模块,用于接收主播客户端上传的直播视频数据,并在所述直播视频数据中提取得到多个直播视频帧,直播视频帧中包括直播用户的脸部数据;
参考图像获取模块,用于获取主播客户端选定的参考图像,参考图像中包括设定对象的脸部数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州虎牙科技有限公司,未经广州虎牙科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110756772.8/2.html,转载请声明来源钻瓜专利网。