[发明专利]卷积运算的处理方法、电子设备、移动终端及存储介质有效
申请号: | 202110553804.4 | 申请日: | 2021-05-20 |
公开(公告)号: | CN113392957B | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 庄晨;孟金涛;魏彦杰 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06F17/15 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 黎坚怡 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积 运算 处理 方法 电子设备 移动 终端 存储 介质 | ||
1.一种卷积运算的处理方法,其特征在于,所述方法包括:
获取待处理的卷积运算以及配置数据库;
将所述卷积运算转换为矩阵乘法,所述矩阵乘法对应一卷积尺寸,包括:对卷积执行Im2col算法,以将所述卷积运算转换成所述卷积对应的矩阵乘法计算,所述矩阵乘法对应一卷积尺寸;
判断所述配置数据库中是否有所述卷积尺寸对应的配置参数;
若所述配置数据库中有所述卷积尺寸对应的配置参数,则按照所述配置参数生成运算代码并进行计算得到运算结果;
若确定所述配置数据库中无所述卷积尺寸对应的配置参数,则根据所述卷积尺寸以及硬件参数定义一参数搜索空间,包括:根据所述硬件参数配置所述卷积尺寸对应的多组参数组合,得到所述配置参数;从多组所述参数组合中选取一组;基于选取的一组参数组合,定义对应的所述参数搜索空间;其中所述卷积尺寸对应的所述配置参数至少包括第一矩阵的行数、第一矩阵的列数、第一矩阵的缓存块的行数、第一矩阵的缓存块的列数、第二矩阵的列数、第二矩阵的缓存块的列数、寄存器块的行数、寄存器块的列数、第一矩阵的预取值、第二矩阵的预取值以及搜索空间标签;根据所述参数搜索空间中的配置参数生成多个运算代码,并利用所述多个运算代码对所述矩阵乘法进行计算,以得到多个运算结果,包括:
基于选取的参数组合,在所述参数搜索空间中,生成所述卷积对应的多个运算代码;
利用所述多个运算代码,对所述矩阵乘法进行计算,得到第一运算结果以及第I运算结果,其中I为大于1的正整数且小于或等于所述运算代码的个数;
将所述多个运算结果中满足预设条件的一个运算结果对应的运算代码的配置参数,存储至所述配置数据库,包括:
判断所述第一运算结果和/或所述第I运算结果是否满足预设条件,所述预设条件至少包括所述矩阵乘法计算的时间段为多个运算结果中最短;
若所述第一运算结果和/或所述第I运算结果满足预设条件,则将所述第一运算结果和/或所述第I运算结果对应的所述配置参数存储至所述配置数据库;
若所述第一运算结果和/或第I运算结果不满足预设条件,则舍弃所述第I运算结果对应的所述配置参数,并将所述第一运算结果对应的所述配置参数存储至所述配置数据库。
2.根据权利要求1所述的处理方法,其特征在于,
所述第一矩阵的缓存块的行数的取值范围为[8,max(M,1024)],所述M为所述第一矩阵的行数,所述第一矩阵的缓存块的列数的取值范围为[8,max(K,1024)],所述K为所述第一矩阵的列数,所述第二矩阵的缓存块的列数的取值范围为[8,max(N,1024)],所述N为所述第二矩阵的行数,所述寄存器块的行数的取值范围为4或8,所述寄存器块的列数为8、12或16,第一矩阵的预取值以及第二矩阵的预取值至少包括0、32、64、128、256或512之一,所述搜索空间标签取值至少包括0、1、2或3。
3.一种移动终端,其特征在于,包括:处理器和存储器,所述存储器中存储有计算机程序,所述处理器用于执行所述计算机程序以实现如权利要求1或2所述的处理方法。
4.一种计算机可读存储介质,其特征在于,该计算机可读存储介质存储有计算机程序,计算机程序能够被处理器执行时实现如权利要求1或2所述的处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110553804.4/1.html,转载请声明来源钻瓜专利网。