[发明专利]一种CNN卷积层运算方法及CNN卷积层运算加速器有效

申请号：	202010791455.5	申请日：	2020-08-07
公开（公告）号：	CN111967582B	公开（公告）日：	2022-07-08
发明（设计）人：	杨继林	申请（专利权）人：	苏州浪潮智能科技有限公司
主分类号：	G06N3/04	分类号：	G06N3/04;G06N3/063;G06T1/20
代理公司：	济南舜源专利事务所有限公司 37205	代理人：	张营磊
地址：	215100 江苏省苏州市吴***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种 cnn 卷积运算方法加速器
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种CNN卷积层运算方法及CNN卷积层运算加速器，均能够：读入用于对待处理特征图像进行CNN卷积层运算的卷积核，并将读入的卷积核转化为权重矩阵H(h_pq)；按照预先设定的图像大小阈值，读取待处理特征图像上的一个分块图像，并依据所述的权重矩阵H(h_pq)计算当前所读入的分块图像对应的CNN卷积层局部运算结果；判断整幅待处理特征图像是否读取完成：若是，则按照各所述分块图像之间的相对位置关系排布所得到的各CNN卷积层局部运算结果，并拼接得到整幅待处理特征图像对应的CNN卷积层运算结果；若否则继续读入下一个分块图像。本发明用于降低CNN卷积运算的复杂度、降低存储带宽压力以及降低完成CNN卷积层运算的成本。

技术领域

本发明涉及卷积运算加速领域，具体涉及一种CNN卷积层运算方法及CNN卷积层运算加速器。

背景技术

随着CNN(Convolutional Neural Networks，卷积神经网络)的不断发展，CNN在图像分类、图像识别等领域的应用越来越广泛。

CNN卷积层的运算是二维卷积，常见的实现方案是滑窗实现卷积计算，即对k×k卷积核采用专门的控制模块获取同样大小的特征图二维窗，然后将该特征图二维窗在需要进行卷积层计算的特征图上滑动，之后将需要进行卷积层计算的特征图与卷积核对应点做乘加运算。滑窗实现二维卷积的方法比较直观，只要能获取到正确的特征图二维窗，之后的计算过程相对简单。但是，用于产生二维窗的控制模块实现比较复杂。另外，对于k×k卷积核、对于在线输入的需要进行卷积层计算的特征图，往往需要额外增加k-1行存储，由此带来了成本的增加。此外，现有CNN卷积层运算过程中往往需要多次重复读取卷积核中的权重，一定程度上增加了存储带宽压力。

为此，本发明提供一种CNN卷积层运算方法及CNN卷积层运算加速器，用于解决上述问题。

发明内容

针对现有技术的上述不足，本发明提供一种CNN卷积层运算方法及CNN卷积层运算加速器，用于降低CNN卷积运算的复杂度。本发明还用于降低存储带宽压力。本发明还用于降低完成CNN卷积层运算的成本。

第一方面，本发明提供一种CNN卷积层运算方法，包括步骤：

S1、读入用于对待处理特征图像进行CNN卷积层运算的卷积核，并将读入的卷积核转化为权重矩阵H(h_pq)，其中，卷积核为k×k卷积核，h_pq为权重矩阵H(h_pq)的(p，q)元素，p＝0，1，2，…，k-1；q＝0，1，2，…，k-1；

S2、按照预先设定的图像大小阈值，分块图像读取待处理特征图像上的一个分块图像，并依据所述的权重矩阵H(h_pq)计算当前所读入的分块图像对应的CNN卷积层局部运算结果；

S3、判断整幅待处理特征图像是否读取完成，若是，则继续执行步骤S4，否则转而重复执行步骤S2；

S4、按照各所述分块图像之间的相对位置关系，排布步骤S2中得到的各CNN卷积层局部运算结果，之后拼接得到整幅待处理特征图像对应的CNN卷积层运算结果；

其中，步骤S2中依据所述的权重矩阵H(h_pq)计算当前所读入的分块图像对应的CNN卷积层局部运算结果的实现方法包括步骤：

P1、将当前读入的分块图像转化为图像矩阵A(a_ij)，其中，分块图像为m×n像素的数字图像，a_ij为图像矩阵A(a_ij)的(i，j)元素；其中，i＝0，1，2，...，m-1；j＝0，1，2，...，n-1；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司，未经苏州浪潮智能科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010791455.5/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种CNN卷积层运算方法及CNN卷积层运算加速器有效

专利文献下载