[发明专利]卷积神经网络量化处理方法、装置及计算机设备有效
申请号: | 201811644575.1 | 申请日: | 2018-12-30 |
公开(公告)号: | CN109740737B | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 李正;邓建林;李远辉;杨安荣;舒红乔 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积 神经网络 量化 处理 方法 装置 计算机 设备 | ||
1.一种卷积神经网络量化处理方法,所述方法包括
获取卷积神经网络中各卷积层的最大权值及最大偏差量;
计算所述最大权值的第一动态比特位精度值,及最大偏差量的第二动态比特位精度值,包括:获取所述最大权值的整数值,以及所述最大偏差量的整数值;计算预设比特值与所述最大权值的整数值的差值,得到第一动态比特位精度值;计算所述预设比特值与所述最大偏差量的整数值的差值,得到第二动态比特位精度值;其中,所述第一动态比特位精度值与所述第二动态比特位精度值不同;
利用各卷积层对应的所述第一动态比特位精度值和所述第二动态比特位精度值,对相应卷积层的权值和偏差量进行量化;
基于各卷积层中量化后的权值及量化后的偏差量,得到所述卷积神经网络的卷积结果。
2.根据权利要求1所述的方法,所述利用各卷积层对应的所述第一动态比特位精度值和所述第二动态比特位精度值,对相应卷积层的权值和偏差量进行量化,包括:
按照浮点数-定点数转换规则,以所述第一动态比特精度值为阶码,将相应卷积层中的浮点数格式的各权值转换为定点数格式的权值;
按照所述浮点数-定点数转换规则,以所述第二动态比特精度值为阶码,将相应卷积层中的浮点数格式的各偏差值转换为定点数格式的偏差值。
3.根据权利要求1所述的方法,所述基于各卷积层中量化后的权值及量化后的偏差量,得到所述卷积神经网络的卷积结果,包括:
基于所述第一动态比特位精度值,对相应卷积层中量化后的各权值进行移位处理,并基于所述第二动态比特位精度值,对相应卷积层中量化后的各偏差量进行移位处理;
对各层卷积层中移位处理后的权值求和,得到相应卷积层的总权值,并对各层卷积层中移位处理后的偏差值进行求和,得到相应卷积层的总偏差值;
对同一层卷积层的总权值和总偏差值进行求和,得到相应卷积层的卷积结果。
4.根据权利要求3所述的方法,所述基于所述第一动态比特位精度值,对相应卷积层中量化后的各权值进行移位处理,包括:
如果所述第一动态比特位精度值大于零,将相应卷积层中的各权值向第一方向移动所述第一动态比特位精度值比特位;
如果第一动态比特位精度值小于零,将相应卷积层中的各权值向第二方向移动所述第一动态比特位精度值比特位,所述第二方向与所述第一方向是移动方向相反的两个移动方向;
所述基于所述第二动态比特位精度值,对相应卷积层中量化后的各偏差量进行移位处理,包括:
如果所述第二动态比特位精度值大于零,将相应卷积层中的各偏差值向所述第一方向移动所述第二动态比特位精度值比特位;
如果第二动态比特位精度值小于零,将相应卷积层中的各偏差值向所述第二方向移动所述第二动态比特位精度值比特位。
5.根据权利要求1~4任意一项所述的方法,所述方法还包括:
验证所述最大权值与最大偏差量是否相匹配;
如果不匹配,执行步骤所述计算所述最大权值的第一动态比特位精度值,及最大偏差量的第二动态比特位精度值。
6.根据权利要求5所述的方法,所述验证所述最大权值与最大偏差量是否相匹配,包括:
对所述最大权值的整数值与所述最大偏差量的整数值进行比较;
所述不匹配是指所述最大权值的整数值与所述最大偏差量的整数值不相同。
7.根据权利要求1~4任意一项所述的方法,所述方法还包括:
获取样本数据;
将所述样本数据输入卷积神经网络,并利用反向传播算法,对所述样本数据在所述卷积神经网络中进行传输计算,确定所述卷积神经网络中各层卷积层的权值和偏差值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811644575.1/1.html,转载请声明来源钻瓜专利网。