[发明专利]神经网络处理方法、装置、设备及存储介质在审
申请号: | 202210733778.8 | 申请日: | 2022-06-27 |
公开(公告)号: | CN115203122A | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 涂宏斌;章翔;徐学明;张鲁峰;赵瑞敏;杨先明;徐任玉;胡昕岳;王昊天;刘雨芃 | 申请(专利权)人: | 中国长城科技集团股份有限公司;湖南长城科技信息有限公司 |
主分类号: | G06F15/78 | 分类号: | G06F15/78;G06N3/04 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 张菁华 |
地址: | 518000 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 处理 方法 装置 设备 存储 介质 | ||
本申请公开一种神经网络处理方法、装置、设备及存储介质,属于神经网络技术领域。方法包括:先获取计算机设备的位宽和片内存储器的存储容量,以及待处理的神经网络包括的至少一个卷积层中每个卷积层的卷积层参数,再根据位宽、存储容量及每个卷积层的卷积层参数,对每个卷积层的分块策略进行穷举,得到每个卷积层的多个分块策略,之后从每个卷积层的多个分块策略中确定目标分块策略。其中,每个卷积层的目标分块策略是指多个分块策略中对应的访问片外存储器的访问次数最小的分块策略,即是该卷积层较为合适的分块策略,如此在执行每个卷积层时,根据确定的合适的目标分块策略对卷积层数据进行分块,访问片外存储器的访问次数较小,功耗较低。
技术领域
本申请涉及神经网络技术领域,特别涉及一种神经网络处理方法、装置、设备及存储介质。
背景技术
当前人工智能技术在全球的流行引发许多的技术变革,而神经网络算法在人工智能算法中扮演着举足轻重的角色。由于神经网络中卷积层的数据量较大,且计算机设备的片内存储器的存储容量有限,因此卷积层的数据通常存储于计算机设备的片外存储器。计算机设备在处理神经网络的每个卷积层时,会对片外存储器中的卷积层数据进行分块,根据分块对片外存储器的卷积层数据进行多次访问,每次访问均从片外存储器中读取卷积层数据的分块数据,将读取的分块数据搬运至片内存储器,再根据片内存储器存储的分块数据进行每个卷积层的子运算,将子运算得到的分块数据写入片外存储器,直至遍历完每个卷积层在片外存储器中存储的全部卷积层数据,如此通过多次访问、多次搬运以及多个子运算可以得到每个卷积层的运行结果。
现有技术中,计算机设备通常采用固定分块策略对神经网络的每个卷积层进行处理。其中,固定分块策略是指计算机设备对不同神经网络的每个卷积层按照固定分块数据量进行分块,使得每个卷积层进行分块后得到的分块数据的数据量均相同,然后将卷积层的分块数据存储在片外存储器。因此,对于不同神经网络的每个卷积层,根据分块对片外存储器进行多次访问的过程中,从片外存储器中读取的每个分块数据的数据量相同、搬运至片内存储器的每个分块数据的数据量相同、以及写入片内存储器的每个分块数据的数据量相同。比如,对不同神经网络的每个卷积层的输入数据和权重分别进行分块,得到的每个卷积层的输入分块数据的数据量相同和权重分块数据的数据量相同,且根据输入分块数据和权重分块数据进行子运算得到的输出分块数据的数据量相同。
由于不同神经网络的不同卷积层的数据量不同,因此上述采用固定分块策略对神经网络的每个卷积层进行处理的方法,可能导致计算机设备在处理数据量较大的卷积层时访问片外存储器的次数较多,计算机设备的功耗较大。
发明内容
本申请提供了一种神经网络处理方法,可以对神经网络的每个卷积层确定较为合适的分块策略,如此在执行每个卷积层时,可以根据确定的合适的目标分块策略对卷积层数据进行分块,使得访问片外存储器的访问次数较小,功耗较低。所述技术方案如下:
第一方面,提供了一种神经网络处理方法,应用于计算机设备,所述方法包括:
获取所述计算机设备的位宽和片内存储器的存储容量,以及待处理的神经网络包括的至少一个卷积层中每个卷积层的卷积层参数;
根据所述位宽、所述存储容量以及每个卷积层的卷积层参数,对每个卷积层的分块策略进行穷举,得到每个卷积层的多个分块策略;
从每个卷积层的多个分块策略中确定目标分块策略,所述目标分块策略是指所述多个分块策略中对应的访问片外存储器的访问次数最小的分块策略。
作为一个示例,所述根据所述位宽、所述存储容量以及每个卷积层的卷积层参数,对每个卷积层的分块策略进行穷举,得到每个卷积层的多个分块策略,包括:
根据每个卷积层的卷积层参数,穷举每个卷积层的所有分块策略;
从每个卷积层的所有分块策略中确定满足所述位宽和所述存储容量对应的约束条件的分块策略,得到所述多个分块策略。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国长城科技集团股份有限公司;湖南长城科技信息有限公司,未经中国长城科技集团股份有限公司;湖南长城科技信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210733778.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种快速切换起吊倍率的组合吊具
- 下一篇:背照式CIS背面减薄加工工艺