[发明专利]一种神经网络压缩方法及其相关设备在审
申请号: | 202110221937.1 | 申请日: | 2021-02-27 |
公开(公告)号: | CN113065638A | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 聂迎;韩凯;刘振华;王云鹤;许春景 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 神经网络 压缩 方法 及其 相关 设备 | ||
本申请提供一种神经网络压缩方法及其相关设备,可使得压缩后的神经网络对不同图像进行不同精度的图像处理,从而保证图像处理的准确性。本申请的方法包括:获取目标图像;将目标图像输入第一神经网络,得到第二神经网络的量化比特数,其中,第二神经网络用于对目标图像进行图像处理,第二神经网络的量化比特数与图像处理所需的计算量正相关;根据第二神经网络的量化比特数,对第二神经网络的参数进行量化处理,得到量化处理后的第二神经网络。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种神经网络压缩方法及其相关设备。
背景技术
近几年来,深度神经网络在诸如图像分类、目标检测和图像分割等计算机视觉任务上取得了很大的进展。但深度神经网络往往包含大量的模型参数,需占用较大的设备资源(如存储空间和计算量等),难以在终端设备上高效运行。因此,需要对神经网络进行压缩,从而降低神经网络占用的设备资源。
模型量化技术是压缩神经网络的有效方法,该技术可将神经网络的参数从高比特数(例如,32比特)的值转换为低比特数(例如,4比特)的值进行表示,从而明显降低神经网络的参数所占用的资源。
在进行模型量化时,量化比特数(即用户所期望的,神经网络的参数的比特数)通常是预置且固定的,导致神经网络在进行图像处理时,对任何图像的处理精度都是一致的,无法保证图像处理的准确性(例如,若某个图像的处理难度较大,神经网络对其的处理精度较低时,会导致处理结果不够准确)。
发明内容
本申请实施例提供了一种神经网络压缩方法及其相关设备,可使得压缩后的神经网络对不同图像进行不同精度的图像处理,从而保证图像处理的准确性。
本申请实施例的第一方面提供了一种神经网络压缩方法,该方法包括:
当需要对目标图像进行图像处理时,可先获取待处理的目标图像。进一步地,还可获取第一神经网络和第二神经网络,其中,第一神经网络用于压缩第二神经网络,第二神经网络用于对目标图像进行图像处理。
然后,将目标图像输入第一神经网络,得到第二神经网络的量化比特数,其中,第二神经网络的量化比特数与图像处理所需的计算量正相关。例如,若目标图像中的物体比较容易识别,对目标图像进行识别时所需的计算量较少,即第二神经网络对目标图像的处理精度可较低,故第二神经网络的量化比特数则较小。若目标图像中的物体比较难识别,对目标图像进行识别时所需的计算量较多,即第二神经网络对目标图像的处理精度需较高,故第二神经网络的量化比特数则较大。
最后,根据第二神经网络的量化比特数,对第二神经网络的参数进行量化处理,得到量化处理后的第二神经网络,即压缩后的第二神经网络。例如,当第二神经网络的量化比特数为4比特时,则将第二神经网络的参数以4比特的数值进行表示,从而降低第二神经网络所占用的设备资源。
从上述方法可以看出:在获取目标图像后,可将目标图像输入第一神经网络,以得到用于压缩第二神经网络的量化比特数。该量化比特数与对目标图像进行图像处理所需的计算量正相关,若对目标图像进行图像处理所需的计算量较多,则该量化比特数较大,若对目标图像进行图像处理所需的计算量较少,则该量化比特数较小。可见,由于目标图像的处理难度不同,第一神经网络输出的量化比特数则不同,使得对第二神经网络的量化处理程度也不同。如此一来,对于处理难度较小的目标图像,量化处理后的第二神经网络可对其进行精度较小的图像处理,对于处理难度较大的目标图像,量化处理后的第二神经网络可对其进行精度较大的图像处理,从而保证图像处理的准确性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110221937.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种感知网络及数据处理方法
- 下一篇:一种手势识别方法以及相关装置