[发明专利]一种基于精简卷积神经网络的快速视频超分辨率重建方法有效
| 申请号: | 201810467095.6 | 申请日: | 2018-05-16 |
| 公开(公告)号: | CN108830790B | 公开(公告)日: | 2022-09-13 |
| 发明(设计)人: | 蒋刚毅;潘志勇;郁梅;谢登梅;彭宗举;陈芬;邵华 | 申请(专利权)人: | 宁波大学 |
| 主分类号: | G06T3/40 | 分类号: | G06T3/40 |
| 代理公司: | 宁波甬致专利代理有限公司 33228 | 代理人: | 李迎春 |
| 地址: | 315211 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 精简 卷积 神经网络 快速 视频 分辨率 重建 方法 | ||
1.一种基于精简卷积神经网络的快速视频超分辨率重建方法,其特征在于:包括以下步骤:
(1)、建立网络结构:a、将当前帧、当前帧的前两帧以及当前帧的后两帧,共五帧作为系统的输入量,表示为XT,索引T∈{t-2,t-1,t,t+1,t+2},其中t表示当前时刻,并用Yt表示重建的当前视频帧;b、将输入量XT通过特征提取及通道融合法获取到融合输出量,记为H1,然后将H1通过特征映射法获取到映射后的输出量,记为H2,再将H2通过反卷积重建法得到网络结构中重建的当前视频帧Yt;
所述的输入量XT通过特征提取及通道融合法获取到融合输出量的具体步骤为:(b-01)、首先采用滤波器对输入量XT进行卷积提取特征,表示成高维向量,记为H1T,H1T=W1T*XT+b1T,并采用参数线性纠正单元函数对H1T进行非线性操作:H1T=max(H1T,0)+a1Tmin(0,H1T),其中‘*’表示卷积操作,W1T表示对应索引T的大小为f1T×f1T×c1T×n1T的滤波器,f1T表示滤波器W1T的尺寸,c1T表示输入XT的通道数,n1T表示滤波器W1T的个数,b1T表示对应索引T的1×n1T的偏置项,a1T表示H1T的负数部分的系数,该层操作记为Conv(f1T×f1T×c1T×n1T)+PReLU,其中PReLU表示参数线性纠正单元函数;(b-02)、然后采用通道融合层对上述各个索引的H1T进行融合,融合后的输出记为H1,表示为:H1=[H1t-2,H1t-1,H1t,H1t+1,H1t+2],其中,[]操作表示将H1T在通道维度上进行连接,即经过第一部分特征提取及通道融合层后得到的H1包含了所有输入的n1T维特征;
所述的将H1通过特征映射法获取到映射后的输出量的具体步骤为:(b-11)、首先利用通道收缩模块对融合后的输出量H1进行降维,降维后的输出记为H2S,H2S=max(W2S*H1+b2S,0)+a2Smin(0,W2S*H1+b2S),其中,W2S表示大小为f2S×f2S×c2S×n2S的滤波器,b2S表示1×n2S的偏置项,a2S表示W2S*H1+b2S的负数部分的系数,该层操作记为Conv(f2S×f2S×c2S×n2S)+PReLU,其中PReLU表示参数线性纠正单元函数;(b-12)、然后采用m个大小为f2M×f2M×c2M×n2M的滤波器W2M和1×n2M的偏置项b2M对H2S进行多级映射,并通过PReLU函数进行非线性变换得到特征向量,得到的特征向量记为H2M,该层操作记为m×[Conv(f2M×f2M×c2M×n2M)+PReLU];(b-13)、接着采用通道扩展模块对H2M进行升维,升维后的输出记为H2,H2=max(W2E*H2M+b2E,0)+a2Emin(0,W2E*H2M+b2E),其中,W2E表示大小为f2E×f2E×c2E×n2E的滤波器,b2E表示1×n2E的偏置项,a2E表示W2E*H2M+b2E的负数部分的系数,该操作记为Conv(f2E×f2E×c2E×n2E)+PReLU;
(2)、训练网络结构:将训练集记为其中Xt(k)表示t时刻第k个视频样本的低分辨率视频帧训练子图像,Zt(k)表示t时刻第k个视频样本的原始全分辨视频帧训练子图像,N表示训练样本个数,Xt(k)与Zt(k)的缩放比例因子s=2,3,4;用Yt(k)表示重建得到的高分辨率视频帧子图像,采用均方差作为目标函数,最小化Yt(k)与Zt(k)之间的误差,并估计各网络结构中各层的网络参数θ,用随机梯度下降法对网络参数θ进行更新;为了快速得到不同缩放因子s下的重建模型,先从零开始训练s=3的模型A,再相应地微调网络末端的反卷积层的参数,而保持所有卷积层参数不变,分别得到s=2和s=4的模型B和模型C;
(3)、利用训练得到的模型A、模型B以及模型C对相应缩放因子s下的低分辨率视频帧XT进行超分辨率重建,最终得到对应缩放因子s下的重建的当前视频帧Yt。
2.根据权利要求1所述的一种基于精简卷积神经网络的快速视频超分辨率重建方法,其特征在于:上述步骤(1)中,反卷积重建法的具体方法为:对升维后的输出H2反卷积得到网络结构中重建的当前视频帧Yt,其中,表示反卷积操作,可视为卷积操作的逆运算,WD3和bD3分别表示大小为fD3×fD3×cD3×nD3的反卷积滤波器和1×nD3维向量的偏置项,该层操作记为:Deconv(fD3×fD3×cD3×nD3)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810467095.6/1.html,转载请声明来源钻瓜专利网。





