[发明专利]可自适应光照的视频换脸方法有效
申请号: | 202011030579.8 | 申请日: | 2020-09-27 |
公开(公告)号: | CN112132743B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 张启煊;虞晶怡;王有佳 | 申请(专利权)人: | 上海科技大学 |
主分类号: | G06T3/00 | 分类号: | G06T3/00;G06V40/16;G06V10/764 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 徐俊 |
地址: | 201210 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自适应 光照 视频 方法 | ||
本发明要解决的技术问题是:现有的视频换脸无法主动去适配目标人脸所处的环境光线,对模版人脸做相应的调整,导致换脸效果在一些复杂光线环境下不佳,无法达到影视级。为了解决上述技术问题,本发明的技术方案是提供了一种可自适应光照的视频换脸方法。本发明提供了一种以模版人脸反射函数序列作为输入实现带重打光效果的视频换脸方法。本发明在换脸的同时对模版人脸进行了重打光以适应特定环境,使换脸结果更加真实;依据目标人脸还原球谐光照图,无需去现场采集;全自动换脸、全程无需人工调整。
技术领域
本发明涉及一种视频换脸方法,用于实现带重打光的影视级视频换脸,属于计算机视觉、光场、深度学习、影视特效等领域。
背景技术
光场通常被定义为表征在场景中的不同点处的来自不同方向的光的4D函数。与光射线的方向分布有关的信息通常被称为光场数据或4D数据。由于信息提供4个参数(二维位置信息和二维角度信息),因此方向分布与四维(4D)函数相对应。光场可以被解释为场景的2D图像的二维集合。
反射函数是用于描述物体的表面在接受到不同角度光照后与所反射出来的光线的映射关系的函数。反射函数可以被解释为场景的2D图像的二维集合。物体的反射函数可以在如Light Stage一样的设施中采集。
基于图像的渲染(IBR)是一种以全光函数为基础的图形绘制技术。与传统的图形学基于多边形进行渲染不同,基于图像的渲染技术以采集的图像为基础,来合成最终的输出对象。它可以同时提高渲染速度和真实感,具有传统图形表示和渲染方法所不可替代的优势。
GPU英文全称Graphic Processing Unit,中文翻译为“图形处理器”。GPU加速是指设计算法使其匹配GPU的并行结构来起到程序加速的作用。
视频换脸是指通过图像处理算法,采用模板人脸替换视频图像中的目标人脸,并使模板人脸与视频图像融合的过程。目前,在进行视频换脸时,对于视频图像中的目标人脸图像,首先根据预先训练好的网络模型生成模板人脸图像,然后使用该模板人脸图像替换视频图像中的目标人脸图像,并将模板人脸图像与视频图像进行柏松融合,得到换脸后的视频图像。目前现有的技术方案已经能够解决人脸抖动(例如人脸的五官发生偏移)问题,但都无法主动去适配目标人脸所处的环境光线,对模版人脸做相应的调整,导致换脸效果在一些复杂光线环境下不佳,无法达到影视级。
球谐光照(Spherical Harmonic Lighting)就是基于球面调和(SH,SphericalHarmonics)这个数学工具的一种光照/着色算法。
人像光照还原是指根据单张人像利用深度学习技术还原出该对象所处的大致光照环境。
发明内容
本发明要解决的技术问题是:现有的视频换脸无法主动去适配目标人脸所处的环境光线,对模版人脸做相应的调整,导致换脸效果在一些复杂光线环境下不佳,无法达到影视级。
为了解决上述技术问题,本发明的技术方案是提供了一种可自适应光照的视频换脸方法,其特征在于,包括以下步骤:
步骤1、获取目标人脸视频,将目标人脸视频分割为若干场景;
步骤2、利用人脸识别技术在步骤1获得的每个场景中寻找完整的高分辨率人脸;
步骤3、利用步骤1获得的每个场景所对应的场景图像获得每个场景的球谐光照图,包括以下步骤:
步骤301、将场景图像输入到深度学习网络后估计出n个方位的球谐系数,将第i个方位的球谐系数定义为ci,则有:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海科技大学,未经上海科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011030579.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:裙板、车厢及轨道车辆
- 下一篇:业务请求分配方法、装置、计算机设备和存储介质