[发明专利]基于深度神经网络的视频压缩感知与重构方法和装置有效
| 申请号: | 201911104216.1 | 申请日: | 2019-11-13 |
| 公开(公告)号: | CN110933429B | 公开(公告)日: | 2021-11-12 |
| 发明(设计)人: | 张登银;周超;陈灿;李俊江;刘子捷 | 申请(专利权)人: | 南京邮电大学 |
| 主分类号: | H04N19/176 | 分类号: | H04N19/176;H04N19/50;G06N3/04;G06N3/08 |
| 代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 朱远枫 |
| 地址: | 210023 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 神经网络 视频压缩 感知 方法 装置 | ||
1.一种基于深度神经网络的视频压缩感知与重构方法,其特征在于,该方法具体步骤如下:
构建用于对视频非关键帧进行重构的深度神经网络模块,包含构建自适应采样模块、多假设预测模块和残差重构模块构成的端到端的深度神经网络;
输入视频序列,将视频序列分为多个图片组,确定每一个图片组的关键帧和非关键帧;对关键帧进行重构得到重构后的关键帧;
利用所训练完成的深度神经网络对视频序列的非关键帧进行重构;
将重构的关键帧和深度神经网络输出的重构的非关键帧按顺序排列即为所得重构视频信号;
其中构建深度神经网络模块的具体方法包括:输入用于网络训练的视频序列;将视频信号序列分为多个图片组,确定每一个图片组的关键帧和非关键帧;将非关键帧分为多个互不重叠的图像块;
构建自适应采样模块:对非关键帧中每个图像块进行自适应采样得到图像块采样值;
构建多假设预测模块:确定每个图像块对应的假设块;对非关键帧中的每个图像块利用对应的假设块进行自适应采样得到假设块的采样值,根据假设块采样值和图像块采样值,计算每个图像块的预测值,得到多假设预测图像;
构建残差重构模块:对多假设预测图像进行自适应采样,构建多假设预测图像采样值与非关键帧采样值的残差值,根据残差值利用残差重构方法得到非关键帧重构;
将构建的自适应采样模块与多假设预测模块进行级联构建子网络,对子网络进行训练,将子网络预训练得到的参数作为初始值,对整个深度神经网络进行训练,得到训练完成的深度神经网络;
确定每个图像块对应的假设块的具体方法为:
对于非关键帧中每一个b·b图像块,以其位置为中心,在关键帧中框定一个大小为W×W的矩形搜索窗,将搜索窗中所有的重叠的图像块提取作为当前图像块的假设块;将非关键帧中每一个图像块的所有假设块整合在一起,可得一个h×w×(b·b)×n的假设块张量,其中,n代表了每一个图像块对应的假设块的个数,h×w代表待预测的图像块的个数,b·b为假设块的维度;
构建残差重构模块的具体方法为:
多假设预测图像进行自适应采样,得到多假设预测图像的采样值,维度大小为h×w×(SR·b·b);
将多假设采样值与基于图像块采样值得非关键帧采样值相减,得到残差采样值;
将残差采样值通过一个卷积层,转换成一个大小为h×w×(b·b)的特征图;此卷积层的卷积核大小为1×1,输入信道数为SR·b·b,输出信道数为b·b;
将输出特征图进行变形,得到一个(h·b)×(w·b)大小的特征图;
利用卷积层对得到的特征图进行卷积,得到残差图像的重构结果;
得到的残差重构结果与多假设预测图像相加,输出最后的非关键帧重构值。
2.根据权利要求1所述的一种基于深度神经网络的视频压缩感知与重构方法,其特征在于,计算每个图像块预测值的计算公式如下:
其中,Pi为当前非关键帧中第i个图像块块的预测结果,hi,j为第i个图像块中第j个假设块,ωi,j为此假设块的权重,qi,j为利用自适应采样对假设块进行采样的结果,yi为第i个图像块的自适应采样值,p(·)为一个非线性映射函数,用于将采样值从低维转换成高维。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911104216.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种阻燃聚酰胺纤维及其制备方法
- 下一篇:一种小区停车管理系统及其管理方法





