[发明专利]一种基于统计分析的自适应权重位宽的量化方法及装置在审
申请号: | 202210992144.4 | 申请日: | 2022-08-17 |
公开(公告)号: | CN115470885A | 公开(公告)日: | 2022-12-13 |
发明(设计)人: | 付冲;欧阳鹏 | 申请(专利权)人: | 北京清微智能科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 北京索睿邦知识产权代理有限公司 11679 | 代理人: | 李根 |
地址: | 100192 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 统计分析 自适应 权重 量化 方法 装置 | ||
1.一种基于统计分析的自适应权重位宽的量化方法,其特征在于,所述方法包括:
获取输入数据和浮点权重,并按照额定量化位宽对所述输入数据和浮点权重进行量化得到量化数据和量化权重;
对所述量化权重与量化数据进行乘加运算得到卷积和数据;
确定所得到的卷积和数据中最大卷积和数据的位宽,作为最大位宽;
获取用于存储卷积和数据的额定存储位宽;
在所述最大位宽小于额定存储位宽的情况下,增加所述额定量化位宽并按照增加后的额定量化位宽对所述浮点权重进行量化。
2.如权利要求1所述的基于统计分析的自适应权重位宽的量化方法,其特征在于,增加所述额定量化位宽的步骤,包括:
计算所述额定存储位宽与最大位宽的差值,利用所得到的差值增加所述额定量化位宽。
3.如权利要求3所述的基于统计分析的自适应权重位宽的量化方法,其特征在于,利用所得到的差值增加所述额定量化位宽的步骤,包括:
计算所得到的差值与所述额定量化位宽的和值;
获取所述额定量化位宽的额定上限值;
在所述和值小于所述额定上限值的情况下,利用所述和值更新所述额定量化位宽;在所述和值不小于所述额定上限值的情况下,利用所述额定上限值更新所述额定量化位宽。
4.一种基于统计分析的自适应权重位宽的量化装置,其特征在于,所述装置包括:
量化模块,用于获取输入数据和浮点权重,并按照额定量化位宽对所述输入数据和浮点权重进行量化得到量化数据和量化权重;
乘加模块,用于对所述量化权重与量化数据进行乘加运算得到卷积和数据;
确定模块,用于确定所得到的卷积和数据中最大卷积和数据的位宽,作为最大位宽;
获取模块,用于获取用于存储卷积和数据的额定存储位宽;
调整模块,用于在所述最大位宽小于额定存储位宽的情况下,增加所述额定量化位宽并按照增加后的额定量化位宽对所述浮点权重进行量化。
5.如权利要求4所述的基于统计分析的自适应权重位宽的量化装置,其特征在于,所述调整模块,还用于计算所述额定存储位宽与最大位宽的差值,利用所得到的差值增加所述额定量化位宽。
6.如权利要求7所述的基于统计分析的自适应权重位宽的量化装置,其特征在于,所述调整模块,还用于计算所得到的差值与所述额定量化位宽的和值;获取所述额定量化位宽的额定上限值;在所述和值小于所述额定上限值的情况下,利用所述和值更新所述额定量化位宽;在所述和值不小于所述额定上限值的情况下,利用所述额定上限值更新所述额定量化位宽。
7.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
存储器,用于存放处理器可执行指令;
处理器,用于执行存储器上所存放的指令时,实现权利要求1-3任一所述的方法步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京清微智能科技有限公司,未经北京清微智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210992144.4/1.html,转载请声明来源钻瓜专利网。