[发明专利]一种视频压缩方法及系统有效
申请号: | 201910318187.2 | 申请日: | 2019-04-19 |
公开(公告)号: | CN110234011B | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 林鹏程 | 申请(专利权)人: | 网宿科技股份有限公司 |
主分类号: | H04N19/42 | 分类号: | H04N19/42;H04N19/176;H04N19/625;H04N19/105;G06N3/04 |
代理公司: | 北京华智则铭知识产权代理有限公司 11573 | 代理人: | 陈刚 |
地址: | 200030 上海市徐汇*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频压缩 方法 系统 | ||
1.一种视频压缩方法,其特征在于,所述方法包括:
确定目标视频中的待编码帧和参考帧,并计算所述待编码帧相对于所述参考帧的残差数据;
将所述残差数据输入完成训练的深度神经网络,所述深度神经网络中包括多个全连接层,通过所述多个全连接层降低所述残差数据的维度,并提取降维后的所述残差数据的期望向量与方差向量;
所述深度神经网络中还包括正态采样层,将降维后的所述残差数据的期望向量与方差向量输入所述正态采样层进行正态分布采样,得到压缩数据,将所述压缩数据作为所述待编码帧的压缩数据,其中,所述压缩数据的维度低于降维后的所述残差数据的维度。
2.根据权利要求1所述的方法,其特征在于,计算所述待编码帧相对于所述参考帧的残差数据包括:
计算所述待编码帧与参考帧之间的残差,并将所述残差从时间域转换至频率域,并将转换得到的频率域的残差作为所述待编码帧相对于所述参考帧的残差数据。
3.根据权利要求2所述的方法,其特征在于,计算所述待编码帧与参考帧之间的残差包括:
将所述待编码帧划分为预设数量的目标宏块,并确定每个所述目标宏块在所述参考帧中对应的参考宏块;
分别计算每个所述目标宏块与对应的所述参考宏块之间的局部残差,并将各个所述目标宏块对应的局部残差的组合,作为所述待编码帧与参考帧之间的残差;
相应地,将各个所述局部残差从时间域转换至频率域,并将转换得到的频率域的局部残差的组合,作为所述待编码帧相对于所述参考帧的残差数据。
4.根据权利要求1所述的方法,其特征在于,所述通过所述多个全连接层降低所述残差数据的维度,并提取降维后的所述残差数据的期望向量与方差向量包括:
通过所述深度神经网络中的第一全连接层,将所述残差数据从第一维度降低至第二维度;
分别通过所述深度神经网络中的第二全连接层和第三全连接层,提取所述第二维度的残差数据的期望向量与方差向量;其中,所述期望向量和所述方差向量的维度低于所述第二维度。
5.根据权利要求4所述的方法,其特征在于,所述将降维后的所述残差数据的期望向量与方差向量输入所述正态采样层进行正态分布采样,得到压缩数据包括:
所述第二维度的残差数据的期望向量与方差向量被输入所述正态采样层进行正态分布采样,得到第三维度的压缩数据;其中,所述第三维度低于所述第二维度。
6.根据权利要求4所述的方法,其特征在于,在得到所述待编码帧的压缩数据之后,所述方法还包括:
对所述待编码帧的压缩数据进行反向重构,以将所述压缩数据还原为与所述残差数据的维度相匹配的解码数据。
7.根据权利要求6所述的方法,其特征在于,对所述待编码帧的压缩数据进行反向重构包括:
将所述待编码帧的压缩数据输入解码神经网络中的第一个全连接层,以将所述压缩数据还原至所述第二维度;
将还原至所述第二维度的数据输入所述解码神经网络的第二个全连接层,以将所述第二维度的数据还原至所述第一维度,并将还原至所述第一维度的数据作为与所述残差数据的维度相匹配的解码数据。
8.根据权利要求6所述的方法,其特征在于,在对所述期望向量和所述方差向量进行正态分布采样之后,所述方法还包括:
根据所述期望向量和所述方差向量,计算所述残差数据的相对熵,并通过所述相对熵表征正态分布采样之后的失真度;
相应地,在对所述待编码帧的压缩数据进行反向重构之后,所述方法还包括:
计算还原得到的解码数据与所述残差数据之间的误差,并计算所述误差和所述相对熵的交叉熵,并通过所述交叉熵表征所述解码数据相对于所述残差数据的失真度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网宿科技股份有限公司,未经网宿科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910318187.2/1.html,转载请声明来源钻瓜专利网。