[发明专利]一种基于事件数据驱动的视频去模糊方法有效

专利信息
申请号: 202210124768.4 申请日: 2022-02-10
公开(公告)号: CN114463218B 公开(公告)日: 2023-10-24
发明(设计)人: 查正军;傅雪阳;曹成志;时格格;黄宇坤 申请(专利权)人: 中国科学技术大学
主分类号: G06T5/00 分类号: G06T5/00;G06N3/0464;G06N3/0455;G06N3/048;G06N3/082;G06V20/40;G06V10/80;G06V10/82
代理公司: 安徽省合肥新安专利代理有限责任公司 34101 代理人: 陆丽莉;何梅生
地址: 230026 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 事件 数据 驱动 视频 模糊 方法
【权利要求书】:

1.一种基于事件数据驱动的视频去模糊方法,其特征是按如下步骤进行:

步骤1获取训练视频数据和对应的事件序列,并对事件序列进行分割:

步骤1.1获取训练视频数据集:

获取真实的模糊视频图像集,记为X={x1,x2,…,xi,…,xN},其中,xi表示第i张模糊图像,i=1,2,…,N,N为模糊图像的帧数量;

获取真实的清晰视频图像集,记为Y={y1,y2,…,yi,…,yN},其中,yi表示第i张清晰图像,i=1,2,...,N,N为正常图像的总数;

令I={X,Y}表示训练图像数据集;

步骤1.2对事件序列进行分割:

获取真实的模糊图像集X的真实事件序列;

将真实的模糊视频图像集X输入事件仿真器中并生成合成的事件序列;

根据真实的模糊视频图像集X中所包含的帧数量N,将真实事件序列和合成的事件序列分别划分成相同数量N的分段序列,记为E={e1,...,ei,...,eN},ei表示第i张模糊图像xi所对应的真实和合成的事件序列,i=1,2,...,N,N为事件序列的总数;

步骤2构建视频去模糊神经网络,包括:编码网络、时间记忆模块、空间融合模块、解码网络;

步骤2.1、所述编码网络由M个残差模块和M个下采样层交替排列组成,其中,残差模块具有m个卷积层及其对应的跳线连接,卷积核大小为均为ks,步长均为s,各卷积层之间依次连接有LeakRelu层和批归一化层;

所述第i张模糊图像xi经过所述编码网络的处理后,生成M个不同尺度的图像特征其中,uim表示第i张模糊图像xi在第m个尺度的图像特征;

步骤2.2、所述时间记忆模块包括一个公用的卷积层、两个专用的卷积层、记忆单元;

第i-1个事件序列ei-1和第i+1个事件序列ei+1输入公用的卷积层中进行处理,得到两者的公共特征,再分别经过两个专用的卷积层的处理,相应得到第i-1个事件序列ei-1的键和值以及第i+1个事件序列ei+1的键和值;

所述记忆单元将第i-1个事件序列ei-1的键和值以及第i+1个事件序列ei+1的键和值进行拼接后,再分别输入两个卷积核为1×1的卷积层中,输出两个卷积结果后再通过乘积运算得到第i个事件序列ei与相邻事件序列ei-1和ei+1的关联特征图;最后将所述关联特征图与第i个事件序列ei相加后,得到第i个事件特征图Ci

步骤2.3、所述空间融合模块包括M+1个下采样层、M个上采样层、一个卷积核为1×1的卷积层和融合单元;

所述M个不同尺度的图像特征输入所述空间融合模块中,并分别通过M个下采样层的处理,从而将M个不同尺度的图像特征调整为相同比例的图像特征,再经过一个卷积核为1×1的卷积层后获得第i个特征图Fi

所述第i个事件特征图Ci通过第M+1个下采样层的处理后,得到下采样后的第i个事件特征图C′i

所述融合单元利用式(1)对所述下采样后的第i个事件特征图C′i和第i个特征图Fi进行处理,从而得到第i个融合特征图Feati中第p个像素点的特征进而得到第i个融合特征图Feati

式(1)中,p、q是位置索引,表示第i个事件特征图C′i在p位置处的特征值,Fiq表示第i个特征图Fi在q位置处的特征值,S为特征图的像素点总数;g(·)表示卷积操作;f(·,·)表示乘积函数,并有:

式(2)中,θ(·)和均表示卷积操作;

所述第i个融合特征图Feati分别经过M个上采样层的处理后,获得M个不同尺度的映射特征其中,vim表示第i张模糊图像xi在第m个尺度的图像特征;

步骤2.4、所述解码网络由M个残差模块和M个上采样层交替排列组成,其中,残差模块具有m个卷积层及其对应的跳线连接,卷积核大小为均为ks,步长均为s,各卷积层之间依次连接有LeakRelu层和批归一化层;

所述M个不同尺度的映射特征经过所述解码网络的上采样层处理,获得M个尺度一致的特征图并进行拼接之后,再经过一个卷积操作,从而生成清晰图像

步骤3、利用式(3)构建反向传播的损失函数L:

式(3)中,K为生成清晰图像的像素点数,为第i个模糊图像经过神经网络生成的去模糊图像的第k个像素点,为清晰视频图像集中第i个图像切片对应的第k个像素点;

步骤4、基于真实的模糊图像集X及其分段序列E对视频去模糊神经网络进行训练,并计算损失函数L,同时使用自适应矩估计优化方法以学习率lrs来更新静态检测网络权值,当训练迭代次数达到设定的次数或损失误差达小于所设定的阈值时,训练停止,从而得到最优的去模糊模型;以所述最优的去模糊网络对模糊视频图像进行处理,并获得对应的清晰图像。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210124768.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top