[发明专利]一种基于精简卷积神经网络的快速视频超分辨率重建方法有效

专利信息
申请号: 201810467095.6 申请日: 2018-05-16
公开(公告)号: CN108830790B 公开(公告)日: 2022-09-13
发明(设计)人: 蒋刚毅;潘志勇;郁梅;谢登梅;彭宗举;陈芬;邵华 申请(专利权)人: 宁波大学
主分类号: G06T3/40 分类号: G06T3/40
代理公司: 宁波甬致专利代理有限公司 33228 代理人: 李迎春
地址: 315211 浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 精简 卷积 神经网络 快速 视频 分辨率 重建 方法
【权利要求书】:

1.一种基于精简卷积神经网络的快速视频超分辨率重建方法,其特征在于:包括以下步骤:

(1)、建立网络结构:a、将当前帧、当前帧的前两帧以及当前帧的后两帧,共五帧作为系统的输入量,表示为XT,索引T∈{t-2,t-1,t,t+1,t+2},其中t表示当前时刻,并用Yt表示重建的当前视频帧;b、将输入量XT通过特征提取及通道融合法获取到融合输出量,记为H1,然后将H1通过特征映射法获取到映射后的输出量,记为H2,再将H2通过反卷积重建法得到网络结构中重建的当前视频帧Yt

所述的输入量XT通过特征提取及通道融合法获取到融合输出量的具体步骤为:(b-01)、首先采用滤波器对输入量XT进行卷积提取特征,表示成高维向量,记为H1T,H1T=W1T*XT+b1T,并采用参数线性纠正单元函数对H1T进行非线性操作:H1T=max(H1T,0)+a1Tmin(0,H1T),其中‘*’表示卷积操作,W1T表示对应索引T的大小为f1T×f1T×c1T×n1T的滤波器,f1T表示滤波器W1T的尺寸,c1T表示输入XT的通道数,n1T表示滤波器W1T的个数,b1T表示对应索引T的1×n1T的偏置项,a1T表示H1T的负数部分的系数,该层操作记为Conv(f1T×f1T×c1T×n1T)+PReLU,其中PReLU表示参数线性纠正单元函数;(b-02)、然后采用通道融合层对上述各个索引的H1T进行融合,融合后的输出记为H1,表示为:H1=[H1t-2,H1t-1,H1t,H1t+1,H1t+2],其中,[]操作表示将H1T在通道维度上进行连接,即经过第一部分特征提取及通道融合层后得到的H1包含了所有输入的n1T维特征;

所述的将H1通过特征映射法获取到映射后的输出量的具体步骤为:(b-11)、首先利用通道收缩模块对融合后的输出量H1进行降维,降维后的输出记为H2S,H2S=max(W2S*H1+b2S,0)+a2Smin(0,W2S*H1+b2S),其中,W2S表示大小为f2S×f2S×c2S×n2S的滤波器,b2S表示1×n2S的偏置项,a2S表示W2S*H1+b2S的负数部分的系数,该层操作记为Conv(f2S×f2S×c2S×n2S)+PReLU,其中PReLU表示参数线性纠正单元函数;(b-12)、然后采用m个大小为f2M×f2M×c2M×n2M的滤波器W2M和1×n2M的偏置项b2M对H2S进行多级映射,并通过PReLU函数进行非线性变换得到特征向量,得到的特征向量记为H2M,该层操作记为m×[Conv(f2M×f2M×c2M×n2M)+PReLU];(b-13)、接着采用通道扩展模块对H2M进行升维,升维后的输出记为H2,H2=max(W2E*H2M+b2E,0)+a2Emin(0,W2E*H2M+b2E),其中,W2E表示大小为f2E×f2E×c2E×n2E的滤波器,b2E表示1×n2E的偏置项,a2E表示W2E*H2M+b2E的负数部分的系数,该操作记为Conv(f2E×f2E×c2E×n2E)+PReLU;

(2)、训练网络结构:将训练集记为其中Xt(k)表示t时刻第k个视频样本的低分辨率视频帧训练子图像,Zt(k)表示t时刻第k个视频样本的原始全分辨视频帧训练子图像,N表示训练样本个数,Xt(k)与Zt(k)的缩放比例因子s=2,3,4;用Yt(k)表示重建得到的高分辨率视频帧子图像,采用均方差作为目标函数,最小化Yt(k)与Zt(k)之间的误差,并估计各网络结构中各层的网络参数θ,用随机梯度下降法对网络参数θ进行更新;为了快速得到不同缩放因子s下的重建模型,先从零开始训练s=3的模型A,再相应地微调网络末端的反卷积层的参数,而保持所有卷积层参数不变,分别得到s=2和s=4的模型B和模型C;

(3)、利用训练得到的模型A、模型B以及模型C对相应缩放因子s下的低分辨率视频帧XT进行超分辨率重建,最终得到对应缩放因子s下的重建的当前视频帧Yt

2.根据权利要求1所述的一种基于精简卷积神经网络的快速视频超分辨率重建方法,其特征在于:上述步骤(1)中,反卷积重建法的具体方法为:对升维后的输出H2反卷积得到网络结构中重建的当前视频帧Yt,其中,表示反卷积操作,可视为卷积操作的逆运算,WD3和bD3分别表示大小为fD3×fD3×cD3×nD3的反卷积滤波器和1×nD3维向量的偏置项,该层操作记为:Deconv(fD3×fD3×cD3×nD3)。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波大学,未经宁波大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810467095.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top