[发明专利]一种深度图像/视频压缩网络的训练方法有效
申请号: | 202110357098.6 | 申请日: | 2021-04-01 |
公开(公告)号: | CN113079377B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 陈志波;郭宗昱 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | H04N19/172 | 分类号: | H04N19/172;H04N19/124;H04N19/147;H04N19/42;H04N19/44;H04N19/91;G06N3/04 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;韩珂 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 图像 视频压缩 网络 训练 方法 | ||
1.一种深度图像/视频压缩网络的训练方法,其特征在于,包括:
第一个阶段中,输入的图像x通过变换编码网络ga产生隐层变量y,隐层变量y经过熵编码网络ha产生边际码流z,加上加性均值噪声U后变为带噪边际码流再经过噪声产生分支hsq恢复出覆盖整个隐层空间的量化步长Δ,通过量化步长Δ采样获得均值噪声UΔ生成再通过变换解码网络gs恢复出解码图像同时,采用包含上下文模型gcm的熵估计模块和熵解码模块hs结合带噪边际码流来估计隐层变量的分布,进而在训练时计算隐层变量的码率;此阶段将得到训练好的变换编码网络ga、熵编码网络ha与噪声产生分支hsq;
第二阶段中,固定变换编码网络ga、熵编码网络ha与噪声产生分支hsq,将加性均值噪声U替换为硬量化的方式,采用硬量化的方式得到带噪边际码流以及采用硬量化的方式得到离散的量化结果再输入至变换解码网络gs,第二阶段训练对象为包含上下文模型gcm的熵估计模块和熵解码模块hs、以及变换解码网络gs;
第二阶段中,通过熵编码网络ha输出的边际码流z,采用硬量化的方式得到带噪边际码流并由噪声产生分支输出形状与隐层变量y相同的量化步长Δ′用以量化隐层变量y,再采用硬量化的方式产生离散的量化结果输入至变换解码网络gs恢复出解码图像同时,采用包含上下文模型gcm的熵估计模块和熵解码模块hs结合带噪边际码流来估计隐层变量的分布,进而在训练时计算的码率。
2.根据权利要求1所述的一种深度图像/视频压缩网络的训练方法,其特征在于,所述噪声产生分支由三层卷积层和一个指数激活层依次连接构成,用以保证网络输出的量化步长数值上是正数。
3.根据权利要求1所述的一种深度图像/视频压缩网络的训练方法,其特征在于,第一个阶段中,通过得到的量化步长Δ,在区间[-Δ/2,Δ/2]采样获得均值噪声UΔ,加到隐层变量y上,生成
4.根据权利要求1所述的一种深度图像/视频压缩网络的训练方法,其特征在于,第二阶段中,采用硬量化的方式产生离散的量化结果的公式为:
其中,round表示四舍五入。
5.根据权利要求1所述的一种深度图像/视频压缩网络的训练方法,其特征在于,所述输入的图像x为单独的一幅图像,或者视频中的单帧图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110357098.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种磁材自动化生产线结构
- 下一篇:一种蚧壳虫迁地生活史观测研究方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序