[发明专利]神经网络中的权重存储方法以及基于该方法的处理器有效
| 申请号: | 201810166950.X | 申请日: | 2018-02-28 |
| 公开(公告)号: | CN108510058B | 公开(公告)日: | 2021-07-20 |
| 发明(设计)人: | 韩银和;闵丰;许浩博;王颖 | 申请(专利权)人: | 中国科学院计算技术研究所 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063 |
| 代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇;李科 |
| 地址: | 100190 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 神经网络 中的 权重 存储 方法 以及 基于 处理器 | ||
本发明提供一种神经网络中的权重存储方法以及基于该方法的神经网络存储器。该权重存储方法包括:将原二维权重卷积核构建为三维空间矩阵;查找所述三维空间矩阵中的有效权重并建立有效权重索引,其中,所述有效权重是非零权重,所述有效权重索引用于标记所述有效权重在所述三维空间矩阵的位置;存储所述有效权重以及所述有效权重索引。根据本发明的权重数据存储方法和卷积计算方法能够节省存储空间并提高计算效率。
技术领域
本发明涉及计算机学习技术领域,尤其涉及一种神经网络中的权重存储方法以及基于该方法的神经网络处理器。
背景技术
近年来,深度学习技术得到了飞速发展,在解决高级抽象认知问题,例如图像识别、语音识别、自然语言理解、天气预测、基因表达、内容推荐和智能机器人等领域得到了广泛应用,成为学术界和工业界的研究热点。
深度神经网络是人工智能领域具有最高发展水平的感知模型之一,其通过建立模型来模拟人类大脑的神经连接结构,通过多个变换阶段分层对数据特征进行描述,为图像、视频和音频等大规模数据处理任务带来突破性进展。深度神经网络模型是一种运算模型,由大量节点通过网状互连结构构成,这些节点被称为神经元。每两个节点间连接强度都代表通过该连接信号在两个节点间的加权重,即权重,与人类神经网络中的记忆相对应。
然而,在现有技术中,神经网络存在处理速度慢,运行功耗大等问题。这是由于深度学习技术依赖于极大的计算量,例如,在训练阶段,需要在海量数据中通过反复迭代计算得到神经网络中的权重数据;在推理阶段,同样需要神经网络在极短的响应时间(通常为毫秒级)内完成对输入数据的运算处理,特别是当神经网络应用于实时系统时,例如,自动驾驶领域。神经网络中涉及的计算主要包括卷积操作、激活操作和池化操作等,其中,卷积过程占用了神经网络处理的大部分时间,该过程主要将输入的神经元或像素与相应卷积核的权重进行乘累加处理。
因此,为了将神经网络推向更广泛应用,例如,智能穿戴、智能机器人、自动驾驶以及模式识别等领域,需要对现有技术进行改进,以实现数据处理的实时性、低功耗以及计算资源利用率的提升。
发明内容
本发明的目的在于克服上述现有技术的缺陷,提供一种权重数据存储方法和基于该方法的神经网络处理器。
根据本发明的第一方面,提供了一种神经网络中的权重数据存储方法。该存储方法包括以下步骤:
步骤1:将原二维权重卷积核构建为三维空间矩阵;
步骤2:查找所述三维空间矩阵中的有效权重并建立有效权重索引,其中,所述有效权重是非零权重,所述有效权重索引用于标记所述有效权重在所述三维空间矩阵的位置;
步骤3:存储所述有效权重以及所述有效权重索引。
在一个实施例中,步骤1还包括:
步骤21:将所述三维空间矩阵规整化为正方体形式的三维空间矩阵,其中,正方体的边长满足Km,K为大于等于2的整数,m为大于等于2的整数;
在一个实施例中,步骤2包括:
步骤22:将所述三维空间矩阵等分为K3个子空间,其中,K为大于等于2的整数;
步骤23:对于所述K3个子空间中包含有效权重的子空间进一步递归式K3等分,直到子空间仅包含一个权重,从而获得多级子空间;
步骤24:对于所述多级子空间中包含有效权重的子空间,标记有效分支,并通过组合各级有效分支获得所述有效权重索引。
在一个实施例中,在步骤24中,对于所述多级子空间中包含有效权重的子空间,标记该子空间对应的分支为比特值1,当该子空间中不包含有效权重时,标记该子空间对应的分支为比特值0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810166950.X/2.html,转载请声明来源钻瓜专利网。





