[发明专利]一种深度神经网络的量化方法及装置在审
申请号: | 201910478915.6 | 申请日: | 2019-06-03 |
公开(公告)号: | CN110188880A | 公开(公告)日: | 2019-08-30 |
发明(设计)人: | 刘明华;赵建仁 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 四川省成都市天策商标专利事务所 51213 | 代理人: | 郭会 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 量化 神经网络 迭代训练 网络层 准确度 计算资源 原始模型 初始化 二值化 压缩率 准确率 更新 可选 可用 收敛 存储 网络 消耗 | ||
本发明公开了一种深度神经网络的量化方法,包括:针对深度神经网络待量化的网络层,进行量化初始化;根据量化模式,对待量化网络层的权值进行量化操作;根据量化后的权值进行网络的迭代训练,并更新权值直到深度神经网络收敛。本发明的方法,包括二值化、三值化等可选模式,以一种机制来对权值进行量化,然后,在迭代训练过程中,不断更新量化权值,直至满足目标任务准确度的要求,最后得到的模型可用于多个平台,相对于原始模型,在准确率相当的前提下,速度更快,模型更小。本发明的方法克服了深度网络对于计算资源、存储的巨大消耗,在针对目标任务性能的同时,提高深度神经网络的加速比与压缩率。
技术领域
本发明涉及机器学习技术领域,尤其涉及一种深度神经网络的量化方法及装置。
背景技术
近年来,随着人工智能突飞猛进的发展,深度学习的应用也是越来越广泛,特别是在图像分类、目标检测、语音处理、自然语言处理等众多领域取得了巨大的进展,显著的提高了机器学习在不同领域内的应用前景,并且在性能上的提升也是与目共睹的。
深度神经网络的学习过程,是需要大量的原始数据,不断的迭代更新网络参数,以达到目标任务的需求。一般来说,大容量、高复杂度的网络可以更为深入和全面的对原始数据进行学习,从而可以取得一个更好的性能指标,相对于传统的学习方法,深度神经网络具备更好的应用前景,同时,更能满足高目标任务的需求。但是,在得到高性能的结果时,需要消耗的时大量的计算资源和存储空间,同时,还要花费更久的时间。因此,深度神经网络的加速和压缩问题变得至关重要,特别是针对嵌入式设备、集成设备、以及大规模的数据处理中心上面的应用需求。
针对深度神经网络的压缩和加速,已经有一些有效的方法,比如剪枝、蒸馏、量化等方法,但是,这些方法并不能适用于所有的深度神经网络,而常规的量化方法并没有兼顾准确率和速度的需求,那么,如何设计一种能保证网络模型高精度的前提下,还能够更快的完成运算的方法是值得进一步研究的。
发明内容
针对上述问题,本发明提出了一种深度神经网络的量化方法及装置,用于克服深度神经网络对于计算资源、存储的巨大消耗,在针对目标任务性能的同时,能更有效的提高深度神经网络的加速比与压缩率。本发明通过以下技术方案来实现上述目的:
一种深度神经网络的量化方法,包括:
针对深度神经网络待量化的网络层,进行量化初始化;
根据量化模式,对待量化网络层的权值进行量化操作;
根据量化后的权值进行网络的迭代训练,并更新权值直到深度神经网络收敛。
具体为:针对所用的深度神经网络,一般需要量化的网络层是指计算量较大的网络层,比如卷积层、池化层等,对于待量化网络层每个通道内的权重分别求取均值;上述的待量化网络层权值均值的计算具体步骤如下:
A1.分别求取每个通道内权值绝对值的累加和;
A2.每个通道的权值均值的计算方法是:对应通道的权值绝对值的累加和除以当前通道权重的个数;
在三种量化模式中选择一种,一般选择的依据是根据目标任务的要求来确定,然后,根据对应权值的大小,量化到指定值。
当完成权值的量化操作后,对应网络层的计算采用量化后的权值,并且,通过神经网络反向传播计算的方式,不断迭代更新量化后的权值,直至网络训练到收敛。
进一步方案为,所述的量化初始化是计算待量化网络层的每个通道的权值均值。
进一步方案为,所述的每个通道权值均值的计算方法为:
首先求取所有|wi|的累加和,然后在每个通道内,根据当前通道权值的个数Size求平均值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910478915.6/2.html,转载请声明来源钻瓜专利网。