[发明专利]一种基于事件数据驱动的视频去模糊方法有效
| 申请号: | 202210124768.4 | 申请日: | 2022-02-10 |
| 公开(公告)号: | CN114463218B | 公开(公告)日: | 2023-10-24 |
| 发明(设计)人: | 查正军;傅雪阳;曹成志;时格格;黄宇坤 | 申请(专利权)人: | 中国科学技术大学 |
| 主分类号: | G06T5/00 | 分类号: | G06T5/00;G06N3/0464;G06N3/0455;G06N3/048;G06N3/082;G06V20/40;G06V10/80;G06V10/82 |
| 代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 陆丽莉;何梅生 |
| 地址: | 230026 安*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 事件 数据 驱动 视频 模糊 方法 | ||
1.一种基于事件数据驱动的视频去模糊方法,其特征是按如下步骤进行:
步骤1获取训练视频数据和对应的事件序列,并对事件序列进行分割:
步骤1.1获取训练视频数据集:
获取真实的模糊视频图像集,记为X={x1,x2,…,xi,…,xN},其中,xi表示第i张模糊图像,i=1,2,…,N,N为模糊图像的帧数量;
获取真实的清晰视频图像集,记为Y={y1,y2,…,yi,…,yN},其中,yi表示第i张清晰图像,i=1,2,...,N,N为正常图像的总数;
令I={X,Y}表示训练图像数据集;
步骤1.2对事件序列进行分割:
获取真实的模糊图像集X的真实事件序列;
将真实的模糊视频图像集X输入事件仿真器中并生成合成的事件序列;
根据真实的模糊视频图像集X中所包含的帧数量N,将真实事件序列和合成的事件序列分别划分成相同数量N的分段序列,记为E={e1,...,ei,...,eN},ei表示第i张模糊图像xi所对应的真实和合成的事件序列,i=1,2,...,N,N为事件序列的总数;
步骤2构建视频去模糊神经网络,包括:编码网络、时间记忆模块、空间融合模块、解码网络;
步骤2.1、所述编码网络由M个残差模块和M个下采样层交替排列组成,其中,残差模块具有m个卷积层及其对应的跳线连接,卷积核大小为均为ks,步长均为s,各卷积层之间依次连接有LeakRelu层和批归一化层;
所述第i张模糊图像xi经过所述编码网络的处理后,生成M个不同尺度的图像特征其中,uim表示第i张模糊图像xi在第m个尺度的图像特征;
步骤2.2、所述时间记忆模块包括一个公用的卷积层、两个专用的卷积层、记忆单元;
第i-1个事件序列ei-1和第i+1个事件序列ei+1输入公用的卷积层中进行处理,得到两者的公共特征,再分别经过两个专用的卷积层的处理,相应得到第i-1个事件序列ei-1的键和值以及第i+1个事件序列ei+1的键和值;
所述记忆单元将第i-1个事件序列ei-1的键和值以及第i+1个事件序列ei+1的键和值进行拼接后,再分别输入两个卷积核为1×1的卷积层中,输出两个卷积结果后再通过乘积运算得到第i个事件序列ei与相邻事件序列ei-1和ei+1的关联特征图;最后将所述关联特征图与第i个事件序列ei相加后,得到第i个事件特征图Ci;
步骤2.3、所述空间融合模块包括M+1个下采样层、M个上采样层、一个卷积核为1×1的卷积层和融合单元;
所述M个不同尺度的图像特征输入所述空间融合模块中,并分别通过M个下采样层的处理,从而将M个不同尺度的图像特征调整为相同比例的图像特征,再经过一个卷积核为1×1的卷积层后获得第i个特征图Fi;
所述第i个事件特征图Ci通过第M+1个下采样层的处理后,得到下采样后的第i个事件特征图C′i;
所述融合单元利用式(1)对所述下采样后的第i个事件特征图C′i和第i个特征图Fi进行处理,从而得到第i个融合特征图Feati中第p个像素点的特征进而得到第i个融合特征图Feati:
式(1)中,p、q是位置索引,表示第i个事件特征图C′i在p位置处的特征值,Fiq表示第i个特征图Fi在q位置处的特征值,S为特征图的像素点总数;g(·)表示卷积操作;f(·,·)表示乘积函数,并有:
式(2)中,θ(·)和均表示卷积操作;
所述第i个融合特征图Feati分别经过M个上采样层的处理后,获得M个不同尺度的映射特征其中,vim表示第i张模糊图像xi在第m个尺度的图像特征;
步骤2.4、所述解码网络由M个残差模块和M个上采样层交替排列组成,其中,残差模块具有m个卷积层及其对应的跳线连接,卷积核大小为均为ks,步长均为s,各卷积层之间依次连接有LeakRelu层和批归一化层;
所述M个不同尺度的映射特征经过所述解码网络的上采样层处理,获得M个尺度一致的特征图并进行拼接之后,再经过一个卷积操作,从而生成清晰图像
步骤3、利用式(3)构建反向传播的损失函数L:
式(3)中,K为生成清晰图像的像素点数,为第i个模糊图像经过神经网络生成的去模糊图像的第k个像素点,为清晰视频图像集中第i个图像切片对应的第k个像素点;
步骤4、基于真实的模糊图像集X及其分段序列E对视频去模糊神经网络进行训练,并计算损失函数L,同时使用自适应矩估计优化方法以学习率lrs来更新静态检测网络权值,当训练迭代次数达到设定的次数或损失误差达小于所设定的阈值时,训练停止,从而得到最优的去模糊模型;以所述最优的去模糊网络对模糊视频图像进行处理,并获得对应的清晰图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210124768.4/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





