[发明专利]一种基于深度展开网络的视频压缩感知重建方法在审
| 申请号: | 202111239880.4 | 申请日: | 2021-10-25 |
| 公开(公告)号: | CN113992920A | 公开(公告)日: | 2022-01-28 |
| 发明(设计)人: | 张健;武卓远 | 申请(专利权)人: | 北京大学深圳研究生院 |
| 主分类号: | H04N19/42 | 分类号: | H04N19/42;G06N3/04;G06N3/08 |
| 代理公司: | 北京京万通知识产权代理有限公司 11440 | 代理人: | 万学堂;王跃交 |
| 地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 展开 网络 视频压缩 感知 重建 方法 | ||
1.一种基于深度展开网络的视频压缩感知重建方法,其特征在于,包括如下步骤:
S1.构造训练数据集:所述训练数据集由多个数据对构成,每个数据对由多帧压缩而成的观测帧和相应的未经压缩的多帧构成;
S2.构造深度展开网络:将优化压缩感知的半二次分裂算法展开为深度展开网络,并加入稠密特征融合技术;
S3.训练所述深度展开网络:基于所述训练数据集,给定损失函数,使用反向传播和梯度下降算法不断优化所述深度展开网络中的参数,直至损失函数稳定;以及
S4.应用训练好的所述深度展开网络进行视频压缩感知重建过程:输入为压缩而成的观测帧和采样矩阵,输出为重建的视频多帧。
2.根据权利要求1所述的基于深度展开网络的视频压缩感知重建方法,其特征在于,在步骤S1中,构造视频训练数据集用于训练深度展开网络,该训练数据集由多个数据对构成,每个数据对包括一组连续的视频帧和对应的多帧压缩而成的观测帧。
3.根据权利要求1所述的基于深度展开网络的视频压缩感知重建方法,其特征在于,在步骤S2中,所述深度展开网络由优化压缩感知的半二次分裂算法展开而成,所述深度展开网络的网络结构由数据模块和先验模块交替堆叠而成,其中引入3D卷积来提升所述深度展开网络对帧间相关性的表征能力;以及使用稠密特征融合技术减少信息在不同阶段之间传递引起的损失,以及帮助信息自适应地在不同阶段中传输。
4.根据权利要求1所述的基于深度展开网络的视频压缩感知重建方法,其特征在于,在步骤S3中,采用反向传播算法计算损失函数相对于所述深度展开网络中各个参数的梯度,然后基于所述训练数据集采用梯度下降算法优化所述深度展开网络的网络层的参数,直至损失函数数值稳定,获得所述深度展开网络的最优参数。
5.根据权利要求1所述的基于深度展开网络的视频压缩感知重建方法,其特征在于,在步骤S4中,首先利用采集得到的观测帧以及采样矩阵进行粗糙的重建,随后将该重建结果以及采样矩阵送入训练好的所述深度展开网络,输出即为高质量的重建结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学深圳研究生院,未经北京大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111239880.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种物流供应链用管理系统
- 下一篇:一种有色金属锻件拉板装置





