[发明专利]一种基于立体图建模的事件驱动视频超分辨率方法在审
申请号: | 202210245281.1 | 申请日: | 2022-03-14 |
公开(公告)号: | CN114612305A | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 查正军;傅雪阳;曹成志;时格格;朱禹睿 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06T3/40 | 分类号: | G06T3/40;G06N3/04;G06N3/08;G06V10/82;G06V10/80 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 立体图 建模 事件 驱动 视频 分辨率 方法 | ||
1.一种基于立体图建模的事件驱动视频超分辨率方法,其特征是按如下步骤进行:
步骤1获取训练视频数据和对应的事件序列,并对事件序列进行分割:
步骤1.1获取真实的低分辨率视频图像集,并以帧为单位进行存储,记为X={x1,x2,...,xi,...,xN},其中,xi表示第i帧低分辨率图像,i=1,2,...,N,N为低分辨率图像的帧数;获得低分辨率视频图像集X对应的事件序列,并根据帧数N将所述事件序列划分成对应数量的事件序列,记为E={e1,e2,...,ei,...,eN},ei表示第i帧低分辨率图像所对应的事件序列;
获取高分辨率视频图像集,以帧为单位进行存储,记为Y={y1,y2,...,yj,...,yN},其中,yj表示第j帧清晰图像;
令I={X,E,Y}表示训练图像数据集;
步骤2构建视频超分辨率神经网络,包括:像素注意力模块、采样模块、事件图模块、特征交互模块和解码模块;
步骤2.1构建像素注意力模块并用于对图像数据进行特征提取:
所述像素注意力模块由5个卷积层和1个sigmoid函数组成,各个卷积层中的卷积核大小为均为ks,步长均为s;
所述第i帧低分辨率图像xi输入所述像素注意力模块中,并分别使用第1个卷积层进行处理,从而获得第i帧低分辨率图像xi的键keyi和值valuei;其中,键keyi经过第2个卷积层的处理,得到字典键;同时,键keyi经过第3个卷积层和1个sigmoid层的处理,得到查询键,对所述字典键和查询键进行乘积操作后得到关联矩阵Ai,key;
值valuei经过1个卷积层后,得到处理后的值valuei′,并与关联矩阵Ai,key进行相乘,得到第i张低分辨率图像xi的图像特征C表示通道数;
步骤2.2第i帧低分辨率图像所对应的事件序列ei输入所述采样模块中进行采样处理:
步骤2.2.1将第i个事件序列ei进行3D体素化后再平均分成H个块,然后对每个块进行平均处理,得到H个采样后的事件关键点,令第h个事件关键点记为
步骤2.2.2将第h个事件关键点的三维坐标设置为事件特征feati,h,以第h个事件关键点之外的区域作为其邻域
步骤2.2.3利用式(1)对第h个事件关键点对应的事件特征feati,h进行更新,从而得到更新后的第h个事件关键点的事件特征feat′i,h:
feat′i,h=Up(Conv(feati,h)) (1)
式(1),Conv表示局部的卷积操作,Up表示上采样操作;
步骤2.3所述事件图模块利用式(2)对所有事件关键点的事件特征{feat′i,h}H进行立体图形操作,从而得到第i个事件序列ei的全局事件特征
式(2)中,{feat′i,h}H代表第i个事件序列ei的所有事件关键点对应的事件特征;Up表示上采样操作,Conv表示卷积操作;feat′i,q表示第q个事件关键点的事件特征;表示乘积函数,并有:
步骤2.4构建所述特征交互模块并用于融合事件特征和图像特征:
所述特征交互模块包括x个下采样层和y个共享权重的卷积层;
图像特征和全局事件特征输入所述特征交互模块中,经过x个下采样层和y个共享权重的卷积层之后,并利用式(4)得到第g组的共同特征从而得到第i个事件序列ei和第i张低分辨率图像xi的共同特征
式(3)中,·,·表示内积,表示全局事件特征中第g组特征,G表示组数;
步骤2.5所述特征交互模块用于输出最后的高分辨率图像;
步骤2.5.1定义迭代次数为p,并初始化p=1;定义最大迭代次数为P;将所述第i个事件序列ei和第i张低分辨率图像xi的共同特征作为第p次迭代的输入数据;
步骤2.5.2将第p次迭代的输入数据分别输入像素注意力模块和事件图模块中进行处理;并相应得到第p次迭代的全局事件特征和图像特征;
步骤2.5.3所述第p次迭代的全局事件特征和图像特征经过所述特征交互模块的处理后,得到第p+1次迭代的输入数据;
步骤2.5.4将p+1赋值给p后,判断p>P是否成立,若成立,则将第p+1次迭代的输入数据输入所述解码模块中进行处理,从而获得第j帧高分辨率预测图像否则,将返回步骤2.5.2顺序执行;
步骤3、利用式(5)构建反向传播的损失函数LMSE:
式(3)中,R为所述第j帧高分辨率预测图像的像素点数,为第i个低分辨率图像xi经过神经网络生成的高分辨率图像的第r个像素点,为高分辨率视频图像集Y中第i个高分辨率图像yi对应的第r个像素点;
步骤4、基于低分辨率图像集X及其事件序列E对所述视频超分辨率神经网络进行训练,并计算损失函数LMSE,同时以学习率lrs来更新网络权值,当训练迭代次数达到设定的次数或损失误差达小于所设定的阈值时,训练停止,从而得到最优的超分辨率模型;以所述最优的超分辨率网络对低分辨率视频图像及其对应的事件序列进行处理,从而获得对应的高分辨率视频图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210245281.1/1.html,转载请声明来源钻瓜专利网。