[发明专利]一种量化神经网络矩阵的方法、设备、计算机产品及板卡在审
申请号: | 201911349745.8 | 申请日: | 2019-12-24 |
公开(公告)号: | CN113033787A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 中科寒武纪科技股份有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/04 |
代理公司: | 北京维昊知识产权代理事务所(普通合伙) 11804 | 代理人: | 李波;孙新国 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 量化 神经网络 矩阵 方法 设备 计算机 产品 板卡 | ||
1.一种量化神经网络矩阵的方法,包括以下步骤:
压缩所述神经网络矩阵以产生频域矩阵;
扫描所述频域矩阵以产生数组;
降低排序在所述数组后段的数据精度;以及
将降低精度后的数组还原成量化后矩阵。
2.根据权利要求1所述的方法,还包括以下步骤:
接收图像信号;以及
转换所述图像信号为所述神经网络矩阵。
3.根据权利要求1所述的方法,其中所述压缩步骤是采用离散余弦变换。
4.根据权利要求1所述的方法,其中所述扫描步骤是将所述频域矩阵的元素以Z字形方式截取排列。
5.根据权利要求1所述的方法,其中所述降低步骤包括以下步骤:
分割所述数组为N个区段,其中第一区段为所述数组最靠前的区段,第N区段为所述数组最靠后的区段;
维持所述第一区段的数据精度;以及
以降幂方式设定第二区段至第N区段的数据精度,其中N是大于或等于3的正整数。
6.根据权利要求5所述的方法,其中N为3。
7.根据权利要求6所述的方法,其中所述分割步骤包括以下步骤:
定义所述第一区段为所述数组的0-30%;
定义所述第二区段为所述数组的30%-50%;以及
定义所述第三区段为所述数组的50%-100%。
8.根据权利要求6或7所述的方法,其中所述第一区段的数据精度为单精度浮点数,所述设定步骤包括以下步骤:
设定所述第二区段的数据精度为半精度浮点数或八位定点数;以及
设定所述第三区段的数据精度为四位定点数或1比特。
9.根据权利要求5所述的方法,其中N为5。
10.根据权利要求9所述的方法,其中所述分割步骤包括以下步骤:
定义所述第一区段为所述数组的0-20%;
定义所述第二区段为所述数组的20%-40%;
定义所述第三区段为所述数组的40%-60%;
定义所述第四区段为所述数组的60%-80%;以及
定义所述第五区段为所述数组的80%-100%。
11.根据权利要求9或10所述的方法,其中所述第一区段的数据精度为单精度浮点数,所述设定步骤包括以下步骤:
设定所述第二区段的数据精度为半精度浮点数;
设定所述第三区段的数据精度为八位定点数;
设定所述第四区段的数据精度为四位定点数;以及
设定所述第五区段的数据精度为1比特。
12.一种量化神经网络矩阵的设备,包括:
至少一个处理器;
至少一个存储器,其存储有计算机程序指令,当所述计算机程序指令由所述至少一个处理器执行时,使得所述设备执行根据权利要求1-11的任意一项所述的方法。
13.一种计算机可读存储介质,其特征在于,其存储用于电子数据交换的计算机程序,其中,所述计算机程序使得计算机执行如权利要求1-11任一项所述的方法。
14.一种计算机程序产品,其特征在于,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如权利要求1-11任一项所述的方法。
15.一种集成电路芯片,包括根据权利要求12所述的设备。
16.一种板卡,包括根据权利要求15所述的集成电路芯片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科寒武纪科技股份有限公司,未经中科寒武纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911349745.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:乘法器、数据处理方法、装置及芯片
- 下一篇:一种数据处理的方法以及相关装置