[发明专利]神经网络模型的量化方法、设备及计算机存储介质在审
申请号: | 202010568807.0 | 申请日: | 2020-06-19 |
公开(公告)号: | CN111814955A | 公开(公告)日: | 2020-10-23 |
发明(设计)人: | 周旭亚 | 申请(专利权)人: | 浙江大华技术股份有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 瞿璨 |
地址: | 310051 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 模型 量化 方法 设备 计算机 存储 介质 | ||
1.一种神经网络模型的量化方法,其特征在于,所述方法包括:
对所述神经网络模型输入训练图片,进行第一数据类型的计算,获得所述神经网络模型中每一计算层的第一输入数据;
根据至少两种算法获得所述每一计算层的至少两个初始量化因子;
基于所述至少两个初始量化因子获得所述每一计算层量化后的至少两个第二输入数据;
比较所述每一计算层中第一输入数据和每个第二输入数据的相关性;
将相关性最大的第二输入数据对应的初始量化因子作为所述计算层的最终量化因子;
将所述最终量化因子输入所述神经网络模型。
2.根据权利要求1所述的量化方法,其特征在于,所述方法还包括:
将所述计算层之后的数据归一层合并至所述计算层以进行计算。
3.根据权利要求1所述的量化方法,其特征在于,所述计算层包括卷积层和全连接层;所述方法还包括:
将所述卷积层、全连接层的前一层的输出数据类型设置为第二数据类型。
4.根据权利要求3所述的量化方法,其特征在于,所述方法还包括:
将非计算层的前一层的输出数据类型设置为第二数据类型。
5.根据权利要求3所述的量化方法,其特征在于,所述量化因子包括权重量化因子和输入量化因子;所述将所述最终量化因子输入所述神经网络模型,包括:
将所述计算层的输入量化因子传输至前一层,使得所述前一层的输出数据为第二数据类型。
6.根据权利要求5所述的量化方法,其特征在于,所述第一数据类型为浮点类型,所述第二数据类型为定点类型。
7.根据权利要求5所述的量化方法,其特征在于,所述将所述最终量化因子输入所述神经网络模型,还包括:
根据所述权重量化因子计算得到量化权重值,将所述量化权重值输入所述神经网络模型。
8.根据权利要求1所述的量化方法,其特征在于,所述将所述最终量化因子输入所述神经网络模型,包括:
根据所述量化因子将所述计算层的偏置值转换为所述计算层的输出数据类型。
9.一种终端设备,其特征在于,所述设备包括存储器以及与所述存储器耦接的处理器;
其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现如权利要求1~8任一项所述的神经网络模型的量化方法。
10.一种计算机存储介质,其特征在于,所述计算机存储介质用于存储程序数据,所述程序数据在被处理器执行时,用以实现如权利要求1~8任一项所述的神经网络模型的量化方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大华技术股份有限公司,未经浙江大华技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010568807.0/1.html,转载请声明来源钻瓜专利网。