[发明专利]用于使用深度强化学习进行端到端神经压缩的方法和装置在审
| 申请号: | 202180021365.0 | 申请日: | 2021-09-24 |
| 公开(公告)号: | CN115298697A | 公开(公告)日: | 2022-11-04 |
| 发明(设计)人: | 蒋薇;王炜;林晟;刘杉 | 申请(专利权)人: | 腾讯美国有限责任公司 |
| 主分类号: | G06T9/00 | 分类号: | G06T9/00 |
| 代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 汪哲雯;蒋雅洁 |
| 地址: | 美国加利福尼亚州*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 使用 深度 强化 学习 进行 端到端 神经 压缩 方法 装置 | ||
1.一种用于使用深度强化学习进行端到端神经图像压缩的方法,所述方法由至少一个处理器执行,以及所述方法包括:
对输入进行编码;
生成所述输入的多个已编码表示;
基于先前量化状态集,使用第一神经网络生成量化键集,其中,所述量化键集中的每个量化键和所述先前量化状态集中的每个先前量化状态对应于所述多个已编码表示;
基于所述量化键集,使用第二神经网络生成解量化数字集,其中,所述解量化数字集表示所述多个已编码表示的解量化表示;以及
基于所述解量化数字集来生成重建输出。
2.根据权利要求1所述的方法,其中,所述输入的所述多个已编码表示是数字流。
3.根据权利要求1所述的方法,还包括:
通过对所述量化键集进行熵编码来生成已编码量化键集;以及
通过对所述已编码量化键集进行熵解码来生成已解码量化键集,
其中,所述解量化数字集是基于所述已解码量化键集、使用所述第二神经网络生成的,以及
其中,所述第二神经网络是深度强化学习DRL解量化神经网络。
4.根据权利要求1所述的方法,还包括:
使用分块量化方法、个体量化方法和静态量化模型方法中的至少一个,生成所述量化键集;以及
使用分块解量化方法、个体解量化方法和静态解量化模型方法中的至少一个,生成所述解量化数字集。
5.根据权利要求4所述的方法,其中,所述量化键集的量化方法与所述解量化数字集的解量化方法相同;
其中,基于所述量化键集使用所述分块量化方法作为所述量化方法,所述解量化数字集使用所述分块解量化方法作为所述解量化方法;
其中,基于所述量化键集使用所述个体量化方法作为所述量化方法,所述解量化数字集使用所述个体解量化方法作为所述解量化方法;以及
其中,基于所述量化键集使用所述静态量化模型方法作为所述量化方法,所述解量化数字集使用所述静态解量化模型方法作为所述解量化方法。
6.根据权利要求1所述的方法,还包括:基于所述先前量化状态集和所述量化键集,通过训练所述第一神经网络来生成当前量化状态集,
其中,所述第一神经网络是DRL量化神经网络。
7.根据权利要求6所述的方法,其中,通过以下训练所述第一神经网络:计算所有可能动作的q值、随机选择一个动作作为具有最优q值的最优动作、生成所选择的最优动作的奖励、对所选择的最优动作集进行采样、以及更新所述第一神经网络的权重参数以最小化失真损失。
8.一种用于使用深度强化学习进行端到端神经图像压缩的装置,所述装置包括:
至少一个存储器,配置成存储程序代码;以及
至少一个处理器,配置成读取所述程序代码并按照所述程序代码的指令进行操作,所述程序代码包括:
编码代码,配置成使得所述至少一个处理器对输入进行编码;
第一生成代码,配置成使得所述至少一个处理器生成所述输入的多个已编码表示;
第二生成代码,配置成使得所述至少一个处理器基于先前量化状态集,使用第一神经网络生成量化键集,其中,所述量化键集中的每个量化键和所述先前量化状态集中的每个先前量化状态对应于所述多个已编码表示;
第三生成代码,配置成使得所述至少一个处理器基于所述量化键集,使用第二神经网络生成解量化数字集,其中,所述解量化数字集表示所述多个已编码表示的解量化表示;以及
解码代码,配置成使得所述至少一个处理器基于所述解量化数字集来对重建输出进行解码。
9.根据权利要求8所述的装置,其中,所述输入的所述多个已编码表示是数字流。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯美国有限责任公司,未经腾讯美国有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180021365.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种医疗器械用的除锈装置
- 下一篇:用于生产分区和/或分层基材的方法和设备





