[发明专利]神经网络卷积权重layout优化的方法、装置、设备及可读介质在审
| 申请号: | 202111166462.7 | 申请日: | 2021-09-30 |
| 公开(公告)号: | CN113869495A | 公开(公告)日: | 2021-12-31 |
| 发明(设计)人: | 王申领;罗建刚 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063;G06N3/08;G06F9/50 |
| 代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 刘小峰;张涛 |
| 地址: | 215000 江苏省苏州*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 神经网络 卷积 权重 layout 优化 方法 装置 设备 可读 介质 | ||
1.一种神经网络卷积的权重layout优化的方法,其特征在于,包括以下步骤:
初始化累加器,由全局加载计算数据和权重数据到共享内存中后将计算数据加载到寄存器中;
将权重数据中的输出通道的维度按照预设算法进行优化;
使用优化后的权重进行矩阵乘计算;
将在累加器中计算后的数据写入全局内存中。
2.根据权利要求1所述的方法,其特征在于,将权重数据中的输出通道的维度按照预设算法进行优化包括:
获取权重数据中的输出通道K的值;
将所述输出通道K的值以32为单位划分为若干大组,每个大组按顺序进行排列;
将每个大组中的值以8为单位按顺序划分成4个小组,并对每个小组进行标号;
将每个小组中以2为单位按顺序划分成4个数组,并对每个数组进行标号;
将每个小组中标号相同的数组按小组标号的顺序放在一起形成新的4个小组;
将得到的全部新的小组按顺序排列得到优化后的输出通道K。
3.根据权利要求1所述的方法,其特征在于,所述权重数据包括输出通道K、卷积核尺寸中的长R、卷积核尺寸中的宽S和输入通道C。
4.根据权利要求3所述的方法,其特征在于,所述输出通道K的值为32的整数倍。
5.一种神经网络卷积的权重layout优化的装置,其特征在于,所述装置包括:
加载模块,所述加载模块配置为初始化累加器,由全局加载计算数据和权重数据到共享内存中后将计算数据加载到寄存器中;
优化模块,所述优化模块配置为将权重数据中的输出通道的维度按照预设算法进行优化;
计算模块,所述计算模块配置为使用优化后的权重进行矩阵乘计算;
存储模块,所述存储模块配置为将在累加器中计算后的数据写入全局内存中。
6.根据权利要求5所述的装置,其特征在于,所述优化模块还配置为:
获取权重数据中的输出通道K的值;
将所述输出通道K的值以32为单位划分为若干大组,每个大组按顺序进行排列;
将每个大组中的值以8为单位按顺序划分成4个小组,并对每个小组进行标号;
将每个小组中以2为单位按顺序划分成4个数组,并对每个数组进行标号;
将每个小组中标号相同的数组按小组标号的顺序放在一起形成新的4个小组;
将得到的全部新的小组按顺序排列得到优化后的输出通道K。
7.根据权利要求5所述的装置,其特征在于,所述权重数据包括输出通道K、卷积核尺寸中的长R、卷积核尺寸中的宽S和输入通道C。
8.根据权利要求7所述的装置,其特征在于,所述输出通道K的值为32的整数倍。
9.一种计算机设备,其特征在于,包括:
至少一个处理器;以及
存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理器执行时实现权利要求1-4任意一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-4任意一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111166462.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种芳基环丁烷化合物的合成方法
- 下一篇:一种芳基环丙烷化合物制备方法





