[发明专利]一种由模糊监控视频重建高分辨率人脸图像的方法与系统有效
申请号: | 202110539509.3 | 申请日: | 2021-05-18 |
公开(公告)号: | CN113160061B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 鲍虎军;王小龙;徐晓刚 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06T3/40 | 分类号: | G06T3/40;G06T5/00;G06T5/40;G06T7/11;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模糊 监控 视频 重建 高分辨率 图像 方法 系统 | ||
1.一种由模糊监控视频重建高分辨率人脸图像的方法,其特征在于,包括以下步骤:
1)检测视频帧图像中人面部区域,得到模糊人脸图像;
2)对模糊人脸图像进行预处理,包括尺寸调整及直方图均衡;
3)利用由图像增强模块、一级图像放大模块、二级图像放大模块和图像优化模块构建的级联模糊人脸重建模型,得到高分辨率人脸图像;具体为:
3.1)图像增强模块:首先对预处理后的模糊人脸图像进行人脸蒙板层处理,然后采用第一编解码网络和图像优化层输出人脸增强图像;
3.2)一级图像放大模块:将人脸增强图像作为输入,采用第二编解码网络、图像优化层和人脸分割层输出一级人脸放大图像和人脸分割图像;
3.3)二级图像放大模块:将一级人脸放大图像和人脸分割图像作为输入,采用第三编解码网络和图像优化层输出二级人脸放大图像;
3.4)图像优化模块:将二级人脸放大图像作为输入,引入随机噪声,采用第四编解码网络和图像优化层输出高分辨率人脸图像。
2.根据权利要求1所述的由模糊监控视频重建高分辨率人脸图像的方法,其特征在于,所述的级联模糊人脸重建模型在训练时,通过判别网络模型,与所述的级联模糊人脸重建模型构成生成式对抗网络,对级联模糊人脸重建模型进行训练。
3.根据权利要求2所述的由模糊监控视频重建高分辨率人脸图像的方法,其特征在于,将级联模糊人脸重建模型输出的结果作为判别网络模型的输入,计算人脸是否准确的置信度;所述的判别网络模型由特征降采样网络和激活函数层构成,计算公式为:
res=sigmoid(featDis) (24)
其中,表示级联模糊人脸重建模型输出的结果,featDis表示判别网络模型中的特征采样网络的输出结果,downsample()表示特征降采样,ResNet()表示残差网络结构,sigmoid()表示激活函数,res表示置信度。
4.根据权利要求1所述的由模糊监控视频重建高分辨率人脸图像的方法,其特征在于,所述的第一编解码网络和第四编码网络由3个编码器和3个解码器级联构成,计算公式为:
其中,encoder()、decoder()分别表示编码器和解码器,feat表示输入特征,feati,i∈[1,6],括号内的feati作为输入特征,括号外的feati作为输出特征;noise表示在编解码过程中注入的随机噪声,feat6作为第一或第四编解码网络的输出。
5.根据权利要求1所述的由模糊监控视频重建高分辨率人脸图像的方法,其特征在于,所述的图像增强模块中的人脸蒙板层采用低通滤波器实现,公式为:
式中,LPF表示低通滤波器,m1、m2表示滤波器尺度,pic表示目标图像,Facemask表示人脸蒙版结果。
6.根据权利要求1所述的由模糊监控视频重建高分辨率人脸图像的方法,其特征在于,所述的第二编解码网络和第三编码网络由3个编码器和4个解码器级联构成,计算公式为:
其中,encoder()、decoder()分别表示编码器和解码器,feat表示编解码器输入特征,feati,i∈[1,7],括号内的feati作为输入特征,括号外的feati作为输出特征;noise表示在编解码过程中注入的随机噪声,其中feat7作为第二或第三编解码网络的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110539509.3/1.html,转载请声明来源钻瓜专利网。