[发明专利]神经网络加速设备及其操作方法在审
申请号: | 201911216207.1 | 申请日: | 2019-12-02 |
公开(公告)号: | CN111860800A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 张在爀 | 申请(专利权)人: | 爱思开海力士有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06F1/3234 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 赵赫;王璇 |
地址: | 韩国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 加速 设备 及其 操作方法 | ||
1.一种神经网络加速设备,包括:
零值过滤器,通过将权重施加到包括多个数据元素的输入特征来过滤零值即0值,并且通过将包括相对坐标和组边界信息的索引信息与所述输入特征的数据元素进行匹配生成压缩数据包;
乘法器,通过对所述压缩数据包的输入特征和权重执行乘法运算来生成结果数据;以及
特征图提取器,对基于所述相对坐标和所述组边界信息的所述结果数据执行加法运算,并且通过以原始输入特征形式重排加法运算的结果值来生成输出特征图。
2.根据权利要求1所述的神经网络加速设备,进一步包括输出特征图生成器,所述输出特征图生成器通过将激励函数应用于所述输出特征图来将所述输出特征图改变为非线性值,通过执行池化处理来生成最终输出特征图,并且将所述最终输出特征图传送至第一存储器、第二存储器和零值过滤器中的任意一个。
3.根据权利要求1所述的神经网络加速设备,其中所述零值过滤器使用所述输入特征的零值位置、所述权重的零值位置和步长值执行所述零值过滤。
4.根据权利要求1所述的神经网络加速设备,其中所述零值过滤器根据预设标准对所述输入特征的数据元素进行分组,生成多个组之间的相对坐标,并且将所述相对坐标与每组的数据元素进行匹配。
5.根据权利要求4所述的神经网络加速设备,其中所述组边界信息是用于对所述多个组进行划分的1位信息。
6.根据权利要求1所述的神经网络加速设备,其中所述零值过滤器将所述输入特征和所述权重转换为一维矢量即1D矢量,通过对所述输入特征和所述权重执行按位OR运算即按位或运算来过滤所述输入特征和所述权重的非零值位置,并且通过对所述输入特征和所述权重的经过滤非零位置值执行按位AND运算即按位与运算,根据目标边界的权重位置来产生非零位置值。
7.根据权利要求6所述的神经网络加速设备,其中所述零值过滤器通过对所述目标边界的所述非零位置值执行按位或运算来产生整合边界信息。
8.根据权利要求7所述的神经网络加速设备,其中所述零值过滤器在产生所述整合边界信息时根据步长值改变待被执行按位或运算的所述目标边界。
9.根据权利要求6所述的神经网络加速设备,其中每个目标边界对应于滑动窗口的相应位置,转换为所述1D矢量的权重通过所述滑动窗口被施加到转换为所述1D矢量的所述输入特征。
10.根据权利要求1所述的神经网络加速设备,其中所述乘法器在执行所述乘法运算时参照所述索引信息跳过对经过滤的零值压缩数据包的乘法运算。
11.根据权利要求1所述的神经网络加速设备,进一步包括:
第一存储器,存储所述输入特征和所述权重;以及
第二存储器,存储从所述零值过滤器传送的包括所述索引信息的压缩数据包。
12.一种神经网络加速设备的操作方法,所述操作方法包括:
接收输入特征和权重,所述输入特征包括多个数据元素;
通过将所述权重施加到所述输入特征来过滤零值即0值,并且通过将包括相对坐标和组边界信息的索引信息与所述输入特征的数据元素进行匹配来生成压缩数据包;
通过对所述压缩数据包的输入特征和权重执行乘法运算生成结果数据;
对基于所述结果数据的所述相对坐标和所述组边界信息的相乘的结果数据执行加法运算,并且通过以原始输入特征形式重排所述加法运算的结果值来生成输出特征图;并且
通过将激励函数应用于所述输出特征图,将所述输出特征图改变为非线性值,并且通过执行池化处理生成最终输出特征图。
13.根据权利要求12所述的方法,其中生成所述压缩数据包包括使用所述输入特征的零值位置、所述权重的零值位置和步长值来执行零值过滤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于爱思开海力士有限公司,未经爱思开海力士有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911216207.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据流获取方法、获取装置、计算机设备及存储介质
- 下一篇:图像读取装置