[发明专利]视频合成方法、视频合成装置、电子设备及存储介质在审
申请号: | 202310638313.9 | 申请日: | 2023-05-31 |
公开(公告)号: | CN116597147A | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 张旭龙;王健宗;程宁 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V40/16;G06V20/40;G06V10/40;G06T7/194;G06T3/00;G06T5/50;G06N3/045;G06N3/08 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 廖慧贤 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 合成 方法 装置 电子设备 存储 介质 | ||
1.一种视频合成方法,其特征在于,所述方法包括:
获取目标人物图像、目标音频数据、参考人物视频数据;
对所述目标人物图像进行语义分割,得到目标人物前景图像,并对所述目标人物前景图像进行特征提取,得到目标人脸特征;
对所述目标音频数据进行特征提取,得到目标音频内容特征;
对所述参考人物视频数据进行特征提取,得到参考人物姿势特征和参考人物唇形特征;
基于所述目标人脸特征、所述目标音频内容特征、所述参考人物姿势特征和所述参考人物唇形特征,得到目标组合特征向量,所述目标组合特征向量包括目标人物的人物风格特点;
基于预设的视频合成模型对所述目标组合特征向量进行视频合成,得到初始合成视频;
基于预设的背景图像对所述初始合成视频进行背景替换,得到目标合成视频。
2.根据权利要求1所述的视频合成方法,其特征在于,所述对所述参考人物视频数据进行特征提取,得到参考人物姿势特征和参考人物唇形特征,包括:
对所述参考人物视频数据进行语义分割,得到参考人物图像;
基于预设的姿势编码器对所述参考人物图像进行编码处理,得到所述参考人物姿势特征;
对所述参考人物图像进行局部区域分割,得到参考人物唇部图像;
基于预设的唇形编码器对所述参考人物唇部图像进行编码处理,得到所述参考人物唇形特征。
3.根据权利要求1所述的视频合成方法,其特征在于,所述基于所述目标人脸特征、所述目标音频内容特征、所述参考人物姿势特征和所述参考人物唇形特征,得到目标组合特征向量,包括:
基于所述目标音频内容特征对所述参考人物唇形特征进行特征调整,得到目标人物唇形特征;
对所述目标人脸特征、所述参考人物姿势特征、所述目标人物唇形特征进行特征拼接,得到所述目标组合特征向量。
4.根据权利要求1所述的视频合成方法,其特征在于,所述视频合成模型包括MLP网络、视频生成网络,所述基于预设的视频合成模型对所述目标组合特征向量进行视频合成,得到初始合成视频,包括:
基于所述MLP网络对所述目标组合特征向量进行风格参数计算,得到视频风格参数;
基于所述视频生成网络和所述视频风格参数对所述目标组合特征向量进行视频合成,得到所述初始合成视频。
5.根据权利要求1所述的视频合成方法,其特征在于,所述基于预设的背景图像对所述初始合成视频进行背景替换,得到目标合成视频,包括:
对所述初始合成视频进行分帧处理,得到初始视频帧;
对每一初始视频帧进行前景掩码,得到所述初始视频帧对应的前景分割图;
对所述前景分割图、所述背景图像以及所述初始视频帧进行图像融合,得到目标视频帧;
对所述目标视频帧进行拼接处理,得到所述目标合成视频。
6.根据权利要求1至5任一项所述的视频合成方法,其特征在于,所述基于预设的视频合成模型对所述目标组合特征向量进行视频合成,得到初始合成视频之前,所述方法还包括预先训练所述视频合成模型,具体包括:
获取样本人物图像、样本人物视频数据、所述参考人物视频数据;
从所述样本人物图像中提取样本前景图像,从所述样本人物视频数据中提取样本音频数据,并从所述参考人物视频数据中提取所述参考人物图像;
将所述样本前景图像、所述样本音频数据、所述参考人物图像输入至所述视频合成模型中;
基于所述样本前景图像,得到样本人物身份特征,基于所述参考人物图像,得到参考人物姿势特征和参考唇形特征,并基于所述样本音频数据,得到样本音频内容特征;
基于所述样本音频内容特征和所述参考唇形特征,计算样本内容损失值;
对所述参考唇形特征、所述样本人物身份特征、所述参考人物姿势特征进行拼接,得到样本组合特征向量;
基于所述视频合成模型对所述样本组合特征向量进行视频合成,得到样本合成视频;
基于所述样本合成视频和所述样本人物视频数据进行损失计算,得到样本视频损失值;
基于所述样本视频损失值和所述样本内容损失值对所述视频合成模型的模型参数进行更新,以优化所述视频合成模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310638313.9/1.html,转载请声明来源钻瓜专利网。