[发明专利]一种空洞卷积加速系统及其方法在审
| 申请号: | 201811573074.9 | 申请日: | 2018-12-21 |
| 公开(公告)号: | CN109800857A | 公开(公告)日: | 2019-05-24 |
| 发明(设计)人: | 孔文海 | 申请(专利权)人: | 珠海亿智电子科技有限公司 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063;G06F7/544;G06F17/16 |
| 代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 陈慧华 |
| 地址: | 519000 广东省珠海市高*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 卷积 空洞 加速系统 分组 填充 参数设定模块 分组模块 计算过程 空间卷积 累加模块 生成模块 运算结果 运算模块 运算效率 整体系统 准备模块 最终结果 乘法器 卷积核 运算 输出 转化 | ||
本发明提供了一种空洞卷积加速系统,包括:准备模块、参数设定模块、生成模块、分组模块、运算模块以及累加模块。一种空洞卷积加速方法,包括:S1、输入原始卷积和使用的卷积核至系统;S2、输入空洞值和填充数至系统;S3、将原始卷积通过空洞值和填充数转化为空洞卷积;S4、对空洞卷积进行分组;S5、对已被分组的卷积进行运算;S6、汇总各分组的运算结果进而输出最终结果。本发明在空间卷积计算过程中可以提高数据和乘法器的利用率,从而有效提升整体系统的运算效率。
技术领域
本发明涉及一种空洞卷积加速系统及其方法,属于深度神经网络领域。
背景技术
近些年机器学习发展非常迅速,其在很多领域的尝试均表现出了良好的性能;而随着网络的加深,相应的运算量也随之增大;在这种背景下,深度神经网络的加速器应运而生,本发明即是对深度神经网络加速器中针对空洞卷积进行运算加速的一种方法。
空洞卷积解决了在深度神经网络中感受野扩大的问题,主要应用于目标检测、分割领域。比较成功的一个应用案例是SSD,即Single Shot MultiBox Detector,在案例中可以实现网络中端对端直接预测、回归目标边界框的效果。这类计算方法的复杂度较低,在简化目标检测流程的基础上有效提升了速度。而典型的卷积网络计算方式是通过Matrix与Matrix或Vector相乘完成卷积运算,数据的准备主要通过例如在Caffe工程中的im2col来实现。当Matrix与Matrix相乘时,需要考虑行列大小,行列值决定了所需的乘法器数目。但空洞卷积与普通卷积的区别在于同一次卷积计算所需要的数据是不连续的,由于空洞卷积在原有基础上穿插了一些无效的空洞值,这就使得传统乘法的利用率较低,如何有效提升空洞卷积的运算效率是当下需要解决的技术问题。
发明内容
为解决上述问题,本发明提供了一种空洞卷积加速系统,该系统包括以下模块:
准备模块,用于输入原始卷积和使用的卷积核至系统;
参数设定模块,用于输入空洞值和填充数至系统;
生成模块,用于将原始卷积通过空洞值和填充数转化为空洞卷积;
分组模块,用于对空洞卷积进行分组;
运算模块,用于对已被分组的卷积进行运算;
累加模块,用于汇总各分组的运算结果进而输出最终结果。
进一步,所述卷积核是行和列数值相同的矩阵区域。
进一步,所述卷积核包括2×2、3×3、4×4以及5×5的矩阵。
进一步,空洞值和填充数必须相等。
进一步,根据填充数向原始卷积内填充零值。
进一步,填充的零值只会出现矩阵的第一列和最后一列,或者第一行和最后一行。
进一步,对空洞卷积进行分组时,当预分组区域内的行或列出现零值,则将包含零值的区域单独分组。
进一步,对已分组的区域进行运算时,可以使用同一卷积核,也可以组合使用不同的卷积核。
一种空洞卷积加速方法,该方法包括以下步骤:
S1、输入原始卷积和使用的卷积核至系统;
S2、输入空洞值和填充数至系统;
S3、将原始卷积通过空洞值和填充数转化为空洞卷积;
S4、对空洞卷积进行分组;
S5、对已被分组的卷积进行运算;
S6、汇总各分组的运算结果进而输出最终结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海亿智电子科技有限公司,未经珠海亿智电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811573074.9/2.html,转载请声明来源钻瓜专利网。





