[发明专利]卷积神经网络加速引擎、卷积神经网络加速系统及方法有效

专利信息
申请号: 201911377012.5 申请日: 2019-12-27
公开(公告)号: CN111178519B 公开(公告)日: 2022-08-02
发明(设计)人: 曾令仿;程倩雅;张爱乐;程稳;方圣卿;杨霖;李弘南;施展;冯丹 申请(专利权)人: 华中科技大学
主分类号: G06N3/063 分类号: G06N3/063;G06N3/04
代理公司: 华中科技大学专利中心 42201 代理人: 李智
地址: 430074 湖北*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 卷积 神经网络 加速 引擎 系统 方法
【权利要求书】:

1.一种基于卷积神经网络加速系统的卷积神经网络加速方法,所述卷积神经网络加速系统包括3D-Memory,用于存储卷积神经网络模型、输入特征图像和输出特征图像,以及对输入特征图像进行计算;所述3D-Memory中,每个Vault单元的内存控制器中集成了卷积神经网络加速引擎;参与卷积神经网络计算的每个Vault单元内,DRAM存储完整的卷积神经网络模型以及输入特征图像子集,Vault单元内存控制器中集成的卷积神经网络加速引擎用于完成卷积神经网络计算任务的一个子集;所述卷积神经网络加速引擎包括全局缓存和物理PE矩阵;所述物理PE矩阵包括以行列形式排布的多个物理PE单元;每一个物理PE单元用于执行行卷积操作以及相关的部分和累加操作;所述行卷积操作为通过滑窗的方式,将卷积核中的一行权重与输入特征图像的一行像素相乘,并将同一滑动窗口内相乘的结果相加;所述部分和累加操作为将多个行卷积操作的部分中间结果累加,得到输出特征图像的一个像素点的操作;在所述全局缓存和所述物理PE矩阵之间,以及在物理PE单元之间实现数据传输的片上互联总线包括:XY互联总线和邻接互联总线;所述XY互联总线由X总线和Y总线构成,所述物理PE矩阵中,每一行物理PE单元与同一X总线相连,所有的X总线以及所述全局缓存均与Y总线相连;所述物理PE矩阵中,每一列物理PE单元与同一邻接互联总线相连;所述XY互联总线,用于将输入特征图像数据、输出特征图像数据和卷积核参数从所述全局缓存传输到所述物理PE矩阵上,或者将所述物理PE矩阵产生的操作结果传输到所述全局缓存中;所述邻接互联总线,用于在同一列物理PE单元之间传输中间结果;

其特征在于,所述卷积神经网络加速方法包括:

(1)在卷积神经网络的当前层Li,获得输入特征图像ifmsi后,穷举从批处理N、输入特征图像通道C、输出特征图像通道M以及2D特征图像E这四个维度对当前层Li的卷积计算任务进行并行展开的所有分区方案,并进行筛选,使得所保留的分区方案在四个维度的分区粒度都能被当前层Li的形状参数整除,且互不等价;

(2)对于所保留的每一个分区方案,生成各个Vault单元所存储的输入特征图像ifmsi的子集的索引,以及需要存储和计算的输出特征图像子集的索引;

(3)为每一个Vault单元确定映射策略,并根据映射策略将2D特征图像所对应的卷积计算任务子集映射到卷积神经网络加速引擎中的物理PE矩阵中;

(4)对于所保留的每一个分区方案,根据映射策略对剩余的批处理大小N′、输入特征图像通道C′和输出特征图像通道M′这三个维度展开的先后顺序以及在存储层级间传输的数据块大小进行优化,以使得该分区方案对应的数据访问开销最小,将优化结果作为该分区方案所对应调度策略;

(5)若当前层Li为卷积神经网络的最后一层,则转入步骤(6);否则,将数据访问开销最小的K种分区方案所生成的输出特征图像布局作为卷积神经网络中下一层的输入特征图像,并转入步骤(1);

(6)将数据访问开销最小的调度策略确定为最优调度策略,并按照最优调度策略对执行卷积神经网络的计算任务;

其中,K为正整数。

2.如权利要求1所述的卷积神经网络加速方法,其特征在于,所述物理PE单元包括:第一缓存、第二缓存、中间结果缓存、乘法器以及加法器;

所述第一缓存和所述第二缓存均采用双缓存设计;

所述第一缓存中的双缓存分别用于缓存两个不同的行卷积操作的输入特征图像数据;

所述第二缓存中的双缓存分别用于缓存两个不同的行卷积操作的卷积核参数;

所述中间结果缓存用于缓存不同行卷积操作所产生的中间结果;

所述乘法器,用于在行卷积操作中实现卷积核权重与输入特征图像像素之间的乘法运算;

所述加法器,用于在行卷积操作中实现中间结果的加法运算,以及在部分和累加操作中实现卷积操作部分中间结果之间的加法运算。

3.如权利要求2所述的卷积神经网络加速方法,其特征在于,物理PE单元中的第一缓存、第二缓存以及中间结果缓存均通过移位寄存器堆实现。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911377012.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top