[发明专利]数据驱动的深度神经网络量化方法、系统、介质和设备在审
申请号: | 202110482327.7 | 申请日: | 2021-04-30 |
公开(公告)号: | CN113159298A | 公开(公告)日: | 2021-07-23 |
发明(设计)人: | 王浩然;梁俊文 | 申请(专利权)人: | 恒睿(重庆)人工智能技术研究院有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京瀚仁知识产权代理事务所(普通合伙) 11482 | 代理人: | 宋宝库;郭婷 |
地址: | 401121 重庆市渝北*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 驱动 深度 神经网络 量化 方法 系统 介质 设备 | ||
1.一种数据驱动的深度神经网络量化方法,其特征在于,所述方法包括下列步骤:
S1,准备校准数据集,其中,所述校准数据集是用于对所述深度神经网络进行推理的数据集的至少一部分;
S2,选择所述深度神经网络的需要量化的层;
S3,针对所选择的层,以校准数据的误差函数最小为目标,以scale和zero_point值为变量,使用最优化算法逐层进行迭代,从而获得最佳的scale和zero_point值;
S4,基于所述最佳的scale和zero_point值对所述深度神经网络进行量化。
2.根据权利要求1所述的数据驱动的深度神经网络量化方法,其特征在于,在步骤S3之前,所述方法还包括:选择需要量化的参数;
步骤S3具体包括:针对所选择的层以及需要量化的参数,以校准数据的误差函数为最优化目标,以scale和zero_point值为变量,使用最优化算法逐层进行迭代,从而获得所述需要量化的参数的最佳截断值并因此获得最佳的scale和zero_point值。
3.根据权利要求2所述的数据驱动的深度神经网络量化方法,其特征在于,在步骤S3之前、选择需要量化的参数之后,所述方法还包括:针对所述需要量化的参数选择搜索域;
“使用最优化算法逐层进行迭代”的步骤具体包括:逐层在所选择的搜索域内使用最优化算法进行迭代。
4.根据权利要求3所述的数据驱动的深度神经网络量化方法,其特征在于,所述搜索域的范围通过下列方式中的至少一种确定:
人工设置;
采用min-max截断法确定最大值,并以0作为最小值。
5.根据权利要求2至4中任一项所述的数据驱动的深度神经网络量化方法,所述需要量化的参数是feature map和weight中的至少一种。
6.根据权利要求1至4中任一项所述的数据驱动的深度神经网络量化方法,其特征在于,所述误差函数根据所述深度神经网络的类型进行选择。
7.一种数据驱动的深度神经网络量化系统,其特征在于,所述系统包括:
校准数据模块,其用于提供校准数据集,所述校准数据集是用于对所述深度神经网络进行推理的数据集的至少一部分;
量化层选择模块,其用于选择所述深度神经网络的需要量化的层;
最优化模块,其用于针对所述量化层选择模块所选择的层,以校准数据的误差函数最小为目标,以scale和zero_point值为变量,使用最优化算法逐层进行迭代,从而获得最佳的scale和zero_point值;
量化模块,其基于所述最优化模块确定的最佳的scale和zero_point值对所述深度神经网络进行量化。
8.根据权利要求7所述的数据驱动的深度神经网络量化系统,其特征在于,所述系统还包括:量化参数选择模块,其用于选择需要量化的参数;
所述最优化模块针对所选择的层以及需要量化的参数使用最优化算法逐层进行迭代。
9.根据权利要求8所述的数据驱动的深度神经网络量化系统,其特征在于,所述系统还包括:搜索域选择模块,其用于针对所述需要量化的参数选择搜索域;
所述最优化模块针对所选择的层逐层在所述搜索域模块所选择的搜索域内使用最优化算法进行迭代。
10.根据权利要求8或9所述的数据驱动的深度神经网络量化系统,其特征在于,所述需要量化的参数是feature map和weight中的至少一种。
11.一种计算机可读存储介质,其特征在于,所述存储介质中存储有多条程序代码,所述程序代码适用于由处理器加载并运行以执行权利要求1至6中任一项所述的数据驱动的深度神经网络量化方法。
12.一种计算机设备,该计算机设备包括处理器和存储装置,所述存储装置中存储有多条程序代码,其特征在于,所述程序代码适于由所述处理器加载并运行以执行权利要求1至6中任一项所述的数据驱动的深度神经网络量化方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于恒睿(重庆)人工智能技术研究院有限公司,未经恒睿(重庆)人工智能技术研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110482327.7/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置