[发明专利]一种基于三阶张量自编码网络的视频压缩方法有效
申请号: | 201811168316.6 | 申请日: | 2018-10-08 |
公开(公告)号: | CN109302614B | 公开(公告)日: | 2022-01-18 |
发明(设计)人: | 刘光灿;李阳;陈胜勇 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | H04N19/42 | 分类号: | H04N19/42;H04N19/85;G06N3/04;G06N3/08 |
代理公司: | 南京汇盛专利商标事务所(普通合伙) 32238 | 代理人: | 张立荣 |
地址: | 210044 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 张量 编码 网络 视频压缩 方法 | ||
1.一种基于三阶张量自编码网络的视频压缩方法,其特征在于,包括如下步骤:
步骤一、对目标三维视频进行灰度化和归一化的预处理;
步骤二、将目标视频自编码网络中层与层之间的全连接参数设为三阶张量并设置迭代结束条件;
步骤三、进行视频网络的前向传播;
使用第一层网络和下一层网络之间的三个因子矩阵进行模1模2模3乘,再对结果使用sigmoid函数进行映射,得到一个新的三阶张量;分别依次进行5次矩阵和张量模乘得到最终的三阶张量;其中,输入的视频为第一层网络,得到的新的三阶张量为下一层网络,最终的三阶张量为输出视频;
步骤四、判断是否迭代终止,是则跳转到步骤六,输出核张量和解码网络参数;否则继续步骤五;
步骤五、进行视频网络的反向传播;
步骤六、对核张量和解码网络进行编码压缩;
步骤6.1、提取分离得到的核张量和压缩网络参数整数部分和小数部分;
步骤6.2、使用Huffman编码对整数部分进行编码压缩;
步骤6.3、使用标量α乘以分离得到的小数部分并对结果取整,α取2043;
步骤6.4、使用β位二进制对步骤6.3得到的整数进行量化压缩,β取11;
步骤6.5、存储整数和小数两部分的压缩结果;
步骤七、输出压缩视频。
2.根据权利要求1所述基于三阶张量自编码网络的视频压缩方法,其特征在于:步骤二中按照所需的压缩比、峰值信噪比来设置网络的参数和迭代结束条件。
3.根据权利要求1所述基于三阶张量自编码网络的视频压缩方法,其特征在于:所述sigmoid函数公式如下:
4.根据权利要求2所述基于三阶张量自编码网络的视频压缩方法,其特征在于:所述迭代的结束条件为:当误差值小于设定的误差值时,则迭代结束;或者当迭代次数大于设定的迭代次数时,则迭代结束。
5.根据权利要求1所述基于三阶张量自编码网络的视频压缩方法,其特征在于:
步骤五中反向传播步骤为:
步骤5.1、求解输出层到隐含层的梯度;
根据链式法则得到:
其中:
Etotal为张量自编码网络损失函数,Yreal为输入视频,Yout为输出视频,1≤x≤m,1≤y≤n,1≤z≤p,1≤i≤r,1≤j≤s,1≤k≤t,A、B和C为三个因子矩阵;m、r代表矩阵A的大小,n、s代表矩阵B的大小,p、t代表矩阵C的大小,x代表1到m之间的一个整数,y代表1到n的整数,z代表1到p之间的整数,i代表1到r之间的一个整数,j代表1到s之间的一个整数,k代表1到t之间的一个整数,m、n、p、r、s、t属于正整数,代表实数,代表求导符号;
同理可得:
步骤5.2、求解隐含层到隐含层的梯度:
根据链式法则得到:
其中,1≤a≤u,1≤b≤v,1≤c≤w;u、v、w代表张量W的大小,u、v、w为正整数,a代表1到u之间的一个整数,b代表1到v之间的一个整数,c代表1到w之间的一个整数;
其中,
同理可得:
步骤5.3、使用步骤5.2中方法求得所有隐含层到隐含层的梯度
步骤5.4、使用ADAM(自适应矩估计)方法和5.1、步骤5.2和步骤5.3中求得的梯度来更新张量自编码网络参数。
6.根据权利要求1所述基于三阶张量自编码网络的视频压缩方法,其特征在于:步骤7中解压步骤为:
步骤7.1、输入步骤六得到的压缩结果;
步骤7.2、对核张量及压缩网络进行反编码;
对整数部分进行霍夫曼逆变换得到核张量及网络的整数部分;
取出小数部分的二进制压缩表示,并除以α得到核张量及网络的小数部分;
合并核张量及网络的小数和整数部分,得到核张量和网络的参数;
步骤7.3、使用张量模乘进行解压;
步骤7.4、输出解压视频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811168316.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:带宽压缩中基于宏块分割的预测方法
- 下一篇:视频压缩的自适应模板预测方法