[发明专利]一种深度神经网络的量化方法及装置在审

专利信息
申请号: 201910478915.6 申请日: 2019-06-03
公开(公告)号: CN110188880A 公开(公告)日: 2019-08-30
发明(设计)人: 刘明华;赵建仁 申请(专利权)人: 四川长虹电器股份有限公司
主分类号: G06N3/08 分类号: G06N3/08;G06N3/04
代理公司: 四川省成都市天策商标专利事务所 51213 代理人: 郭会
地址: 621000 四*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 量化 神经网络 迭代训练 网络层 准确度 计算资源 原始模型 初始化 二值化 压缩率 准确率 更新 可选 可用 收敛 存储 网络 消耗
【说明书】:

发明公开了一种深度神经网络的量化方法,包括:针对深度神经网络待量化的网络层,进行量化初始化;根据量化模式,对待量化网络层的权值进行量化操作;根据量化后的权值进行网络的迭代训练,并更新权值直到深度神经网络收敛。本发明的方法,包括二值化、三值化等可选模式,以一种机制来对权值进行量化,然后,在迭代训练过程中,不断更新量化权值,直至满足目标任务准确度的要求,最后得到的模型可用于多个平台,相对于原始模型,在准确率相当的前提下,速度更快,模型更小。本发明的方法克服了深度网络对于计算资源、存储的巨大消耗,在针对目标任务性能的同时,提高深度神经网络的加速比与压缩率。

技术领域

本发明涉及机器学习技术领域,尤其涉及一种深度神经网络的量化方法及装置。

背景技术

近年来,随着人工智能突飞猛进的发展,深度学习的应用也是越来越广泛,特别是在图像分类、目标检测、语音处理、自然语言处理等众多领域取得了巨大的进展,显著的提高了机器学习在不同领域内的应用前景,并且在性能上的提升也是与目共睹的。

深度神经网络的学习过程,是需要大量的原始数据,不断的迭代更新网络参数,以达到目标任务的需求。一般来说,大容量、高复杂度的网络可以更为深入和全面的对原始数据进行学习,从而可以取得一个更好的性能指标,相对于传统的学习方法,深度神经网络具备更好的应用前景,同时,更能满足高目标任务的需求。但是,在得到高性能的结果时,需要消耗的时大量的计算资源和存储空间,同时,还要花费更久的时间。因此,深度神经网络的加速和压缩问题变得至关重要,特别是针对嵌入式设备、集成设备、以及大规模的数据处理中心上面的应用需求。

针对深度神经网络的压缩和加速,已经有一些有效的方法,比如剪枝、蒸馏、量化等方法,但是,这些方法并不能适用于所有的深度神经网络,而常规的量化方法并没有兼顾准确率和速度的需求,那么,如何设计一种能保证网络模型高精度的前提下,还能够更快的完成运算的方法是值得进一步研究的。

发明内容

针对上述问题,本发明提出了一种深度神经网络的量化方法及装置,用于克服深度神经网络对于计算资源、存储的巨大消耗,在针对目标任务性能的同时,能更有效的提高深度神经网络的加速比与压缩率。本发明通过以下技术方案来实现上述目的:

一种深度神经网络的量化方法,包括:

针对深度神经网络待量化的网络层,进行量化初始化;

根据量化模式,对待量化网络层的权值进行量化操作;

根据量化后的权值进行网络的迭代训练,并更新权值直到深度神经网络收敛。

具体为:针对所用的深度神经网络,一般需要量化的网络层是指计算量较大的网络层,比如卷积层、池化层等,对于待量化网络层每个通道内的权重分别求取均值;上述的待量化网络层权值均值的计算具体步骤如下:

A1.分别求取每个通道内权值绝对值的累加和;

A2.每个通道的权值均值的计算方法是:对应通道的权值绝对值的累加和除以当前通道权重的个数;

在三种量化模式中选择一种,一般选择的依据是根据目标任务的要求来确定,然后,根据对应权值的大小,量化到指定值。

当完成权值的量化操作后,对应网络层的计算采用量化后的权值,并且,通过神经网络反向传播计算的方式,不断迭代更新量化后的权值,直至网络训练到收敛。

进一步方案为,所述的量化初始化是计算待量化网络层的每个通道的权值均值。

进一步方案为,所述的每个通道权值均值的计算方法为:

首先求取所有|wi|的累加和,然后在每个通道内,根据当前通道权值的个数Size求平均值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910478915.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top