[发明专利]一种深度图像/视频压缩网络的训练方法有效

申请号：	202110357098.6	申请日：	2021-04-01
公开（公告）号：	CN113079377B	公开（公告）日：	2022-09-30
发明（设计）人：	陈志波;郭宗昱	申请（专利权）人：	中国科学技术大学
主分类号：	H04N19/172	分类号：	H04N19/172;H04N19/124;H04N19/147;H04N19/42;H04N19/44;H04N19/91;G06N3/04
代理公司：	北京凯特来知识产权代理有限公司 11260	代理人：	郑立明;韩珂
地址：	230026 安***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种深度图像视频压缩网络训练方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种深度图像/视频压缩网络的训练方法，其特征在于，包括：

第一个阶段中，输入的图像x通过变换编码网络g_a产生隐层变量y，隐层变量y经过熵编码网络h_a产生边际码流z，加上加性均值噪声U后变为带噪边际码流再经过噪声产生分支h_sq恢复出覆盖整个隐层空间的量化步长Δ，通过量化步长Δ采样获得均值噪声U_Δ生成再通过变换解码网络g_s恢复出解码图像同时，采用包含上下文模型g_cm的熵估计模块和熵解码模块h_s结合带噪边际码流来估计隐层变量的分布，进而在训练时计算隐层变量的码率；此阶段将得到训练好的变换编码网络g_a、熵编码网络h_a与噪声产生分支h_sq；

第二阶段中，固定变换编码网络g_a、熵编码网络h_a与噪声产生分支h_sq，将加性均值噪声U替换为硬量化的方式，采用硬量化的方式得到带噪边际码流以及采用硬量化的方式得到离散的量化结果再输入至变换解码网络g_s，第二阶段训练对象为包含上下文模型g_cm的熵估计模块和熵解码模块h_s、以及变换解码网络g_s；

第二阶段中，通过熵编码网络h_a输出的边际码流z，采用硬量化的方式得到带噪边际码流并由噪声产生分支输出形状与隐层变量y相同的量化步长Δ′用以量化隐层变量y，再采用硬量化的方式产生离散的量化结果输入至变换解码网络g_s恢复出解码图像同时，采用包含上下文模型g_cm的熵估计模块和熵解码模块h_s结合带噪边际码流来估计隐层变量的分布，进而在训练时计算的码率。

2.根据权利要求1所述的一种深度图像/视频压缩网络的训练方法，其特征在于，所述噪声产生分支由三层卷积层和一个指数激活层依次连接构成，用以保证网络输出的量化步长数值上是正数。

3.根据权利要求1所述的一种深度图像/视频压缩网络的训练方法，其特征在于，第一个阶段中，通过得到的量化步长Δ，在区间[-Δ/2,Δ/2]采样获得均值噪声U_Δ，加到隐层变量y上，生成

4.根据权利要求1所述的一种深度图像/视频压缩网络的训练方法，其特征在于，第二阶段中，采用硬量化的方式产生离散的量化结果的公式为：

其中，round表示四舍五入。

5.根据权利要求1所述的一种深度图像/视频压缩网络的训练方法，其特征在于，所述输入的图像x为单独的一幅图像，或者视频中的单帧图像。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学技术大学，未经中国科学技术大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110357098.6/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

H 电学

H04 电通信技术
H04N 图像通信，如电视

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种深度图像/视频压缩网络的训练方法有效

专利文献下载