[发明专利]一种CNN卷积层运算方法及CNN卷积层运算加速器有效
申请号: | 202010791455.5 | 申请日: | 2020-08-07 |
公开(公告)号: | CN111967582B | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 杨继林 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063;G06T1/20 |
代理公司: | 济南舜源专利事务所有限公司 37205 | 代理人: | 张营磊 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 cnn 卷积 运算 方法 加速器 | ||
本发明提供一种CNN卷积层运算方法及CNN卷积层运算加速器,均能够:读入用于对待处理特征图像进行CNN卷积层运算的卷积核,并将读入的卷积核转化为权重矩阵H(hpq);按照预先设定的图像大小阈值,读取待处理特征图像上的一个分块图像,并依据所述的权重矩阵H(hpq)计算当前所读入的分块图像对应的CNN卷积层局部运算结果;判断整幅待处理特征图像是否读取完成:若是,则按照各所述分块图像之间的相对位置关系排布所得到的各CNN卷积层局部运算结果,并拼接得到整幅待处理特征图像对应的CNN卷积层运算结果;若否则继续读入下一个分块图像。本发明用于降低CNN卷积运算的复杂度、降低存储带宽压力以及降低完成CNN卷积层运算的成本。
技术领域
本发明涉及卷积运算加速领域,具体涉及一种CNN卷积层运算方法及CNN卷积层运算加速器。
背景技术
随着CNN(Convolutional Neural Networks,卷积神经网络)的不断发展,CNN在图像分类、图像识别等领域的应用越来越广泛。
CNN卷积层的运算是二维卷积,常见的实现方案是滑窗实现卷积计算,即对k×k卷积核采用专门的控制模块获取同样大小的特征图二维窗,然后将该特征图二维窗在需要进行卷积层计算的特征图上滑动,之后将需要进行卷积层计算的特征图与卷积核对应点做乘加运算。滑窗实现二维卷积的方法比较直观,只要能获取到正确的特征图二维窗,之后的计算过程相对简单。但是,用于产生二维窗的控制模块实现比较复杂。另外,对于k×k卷积核、对于在线输入的需要进行卷积层计算的特征图,往往需要额外增加k-1行存储,由此带来了成本的增加。此外,现有CNN卷积层运算过程中往往需要多次重复读取卷积核中的权重,一定程度上增加了存储带宽压力。
为此,本发明提供一种CNN卷积层运算方法及CNN卷积层运算加速器,用于解决上述问题。
发明内容
针对现有技术的上述不足,本发明提供一种CNN卷积层运算方法及CNN卷积层运算加速器,用于降低CNN卷积运算的复杂度。本发明还用于降低存储带宽压力。本发明还用于降低完成CNN卷积层运算的成本。
第一方面,本发明提供一种CNN卷积层运算方法,包括步骤:
S1、读入用于对待处理特征图像进行CNN卷积层运算的卷积核,并将读入的卷积核转化为权重矩阵H(hpq),其中,卷积核为k×k卷积核,hpq为权重矩阵H(hpq)的(p,q)元素,p=0,1,2,…,k-1;q=0,1,2,…,k-1;
S2、按照预先设定的图像大小阈值,分块图像读取待处理特征图像上的一个分块图像,并依据所述的权重矩阵H(hpq)计算当前所读入的分块图像对应的CNN卷积层局部运算结果;
S3、判断整幅待处理特征图像是否读取完成,若是,则继续执行步骤S4,否则转而重复执行步骤S2;
S4、按照各所述分块图像之间的相对位置关系,排布步骤S2中得到的各CNN卷积层局部运算结果,之后拼接得到整幅待处理特征图像对应的CNN卷积层运算结果;
其中,步骤S2中依据所述的权重矩阵H(hpq)计算当前所读入的分块图像对应的CNN卷积层局部运算结果的实现方法包括步骤:
P1、将当前读入的分块图像转化为图像矩阵A(aij),其中,分块图像为m×n像素的数字图像,aij为图像矩阵A(aij)的(i,j)元素;其中,i=0,1,2,...,m-1;j=0,1,2,...,n-1;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010791455.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种显示面板及显示装置
- 下一篇:一种多功能的太阳能智慧路灯杆