[发明专利]说话视频生成方法及装置有效
| 申请号: | 202110532690.5 | 申请日: | 2021-05-14 |
| 公开(公告)号: | CN113449590B | 公开(公告)日: | 2022-10-28 |
| 发明(设计)人: | 张智勐;李林橙;丁彧;范长杰;胡志鹏 | 申请(专利权)人: | 网易(杭州)网络有限公司 |
| 主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V20/40;G06V40/20;G06V10/80;G06V10/82;G06N3/04;G06N3/08;G06T9/00;G06T17/00;G10L19/16 |
| 代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 钟扬飞 |
| 地址: | 310052 浙江省杭州*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 说话 视频 生成 方法 装置 | ||
1.一种说话视频生成方法,其特征在于,包括:
基于待生成的说话视频对应的语音帧序列以及参考图像,确定所述语音帧序列中每个语音帧对应的运动参数;
基于所述参考图像、预设人脸模型、以及每个所述语音帧对应的运动参数,确定每个所述语音帧对应的稠密运动场;
基于所述参考图像和每个所述语音帧对应的稠密运动场,生成所述待生成的说话视频中与每个所述语音帧对应的帧图像;
基于所述参考图像、预设人脸模型、以及每个所述语音帧对应的运动参数,确定每个所述语音帧对应的稠密运动场,包括:
基于每个所述语音帧对应的运动参数调整所述预设人脸模型得到每个所述语音帧对应的人脸模型;
将每个所述语音帧对应的人脸模型投影到所述参考图像中,得到每个所述语音帧对应的投影图像;
基于每个所述语音帧对应的投影图像确定每个所述语音帧对应的稠密运动场。
2.根据权利要求1所述的方法,其特征在于,所述基于待生成的说话视频对应的语音帧序列以及参考图像,确定所述语音帧序列中每个语音帧对应的运动参数,包括:
基于预先训练的人脸识别模型对参考图像进行人脸识别,得到人脸特征;
基于预先训练的语音特征提取器对待生成的说话视频对应的语音帧序列中的每个语音帧进行特征提取,得到每个所述语音帧对应的语音特征;
将每个所述语音帧对应的语音特征与所述人脸特征进行融合,得到每个所述语音帧对应的融合特征;
基于每个所述语音帧对应的融合特征,确定每个所述语音帧对应的运动参数。
3.根据权利要求2所述的方法,其特征在于,将每个所述语音帧对应的语音特征与所述人脸特征进行融合,得到每个所述语音帧对应的融合特征,包括:
基于预先训练的全连接网络以及所述人脸特征,确定自适应实例归一化的参数;
将每个所述语音帧对应的语音特征与所述自适应实例归一化的参数进行融合,得到每个所述语音帧对应的融合特征。
4.根据权利要求2所述的方法,其特征在于,运动参数包括嘴唇运动参数、表情运动参数以及头部运动参数;所述基于每个所述语音帧对应的融合特征,确定每个所述语音帧对应的运动参数,包括:
基于每个所述语音帧对应的融合特征和预先训练的运动参数识别模型中的嘴唇运动分支,确定每个所述语音帧对应的嘴唇运动参数;
基于每个所述语音帧对应的融合特征和预先训练的运动参数识别模型中的长时依赖解码器和表情运动分支,确定每个所述语音帧对应的表情运动参数;
基于每个所述语音帧对应的融合特征和预先训练的运动参数识别模型中的长时依赖解码器和头部运动分支,确定每个所述语音帧对应的头部运动参数。
5.根据权利要求1所述的方法,其特征在于,投影图像包括面部区域、躯干区域以及除所述面部区域和所述躯干区域以外的其他区域。
6.根据权利要求5所述的方法,其特征在于,所述基于每个所述语音帧对应的投影图像确定每个所述语音帧对应的稠密运动场包括:
基于每个所述语音帧对应的投影图像与上一语音帧对应的投影图像之间的差别,确定每个所述语音帧对应的第一稠密运动场;
基于每个所述语音帧对应的第一稠密运动场确定每个语音帧对应的面部区域的稠密运动场;
基于每个语音帧对应的第一稠密运动场,确定头部区域的平均运动场,并基于所述头部区域的平均运动场确定每个所述语音帧对应的躯干区域稠密运动场;
基于每个所述语音帧对应的面部区域中面部区域边缘的稠密运动场,确定每个所述语音帧对应的其他区域的稠密运动场;
基于每个所述语音帧对应的面部区域的稠密运动场、躯干区域稠密运动场和其他区域的稠密运动场,确定每个所述语音帧对应的稠密运动场。
7.根据权利要求6所述的方法,其特征在于,所述面部区域与所述头部区域为同一区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网易(杭州)网络有限公司,未经网易(杭州)网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110532690.5/1.html,转载请声明来源钻瓜专利网。





