[发明专利]执行卷积运算操作的方法及装置、生成指令的方法及装置有效
| 申请号: | 201910190531.4 | 申请日: | 2019-03-13 |
| 公开(公告)号: | CN109656623B | 公开(公告)日: | 2019-06-14 |
| 发明(设计)人: | 李智超;王振江;凌坤;李建军 | 申请(专利权)人: | 北京地平线机器人技术研发有限公司 |
| 主分类号: | G06F9/302 | 分类号: | G06F9/302;G06N3/04;G06N3/063 |
| 代理公司: | 北京市正见永申律师事务所 11497 | 代理人: | 黄小临;冯玉清 |
| 地址: | 100080 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 卷积核 卷积运算 输入特征 起点坐标 生成指令 输出特征 卷积 填充 核对 卷积神经网络 硬件成本 硬件执行 整合 运算 申请 | ||
公开了一种执行卷积运算操作的方法及装置、生成指令的方法及装置,该执行卷积运算操作的方法包括:获取第n个第二卷积核;基于第一卷积核在宽度和高度上的尺寸、与第一输入特征数据在宽度和高度上填充后的尺寸、第n个第二卷积核在宽度和高度上的尺寸、和第n个第二卷积核在第一卷积核中的宽度起点坐标和高度起点坐标,从填充后的第一输入特征数据中,获取与第n个第二卷积核对应的第二输入特征数据;对与第n个第二卷积核对应的第二输入特征数据和第n个第二卷积核执行卷积运算操作;以及在得到N个第二输出特征数据后,对N个第二输出特征数据进行整合。本申请能够在不增加硬件成本的前提下提高硬件执行卷积神经网络运算的效率。
技术领域
本申请涉及神经网络技术领域,尤其涉及一种执行卷积运算操作的方法及装置、生成指令的方法及装置。
背景技术
卷积神经网络已成功应用于图像处理、自动驾驶等诸多领域。随着卷积神经网络在诸多领域的应用,一些应用场景下需要在卷积神经网络中应用各种尺寸卷积核的卷积运算操作。然而,专用于执行神经网络计算的硬件(例如,神经网络加速器)因其硬件的限制仅能够直接执行特定尺寸的卷积核的卷积运算操作。
发明内容
为了解决上述技术问题,期望提供一种新的执行卷积运算操作的方法及装置、生成指令的方法及装置,以使因硬件限制而不能支持特定尺寸卷积核的硬件(例如,神经网络加速器)能够完成各种卷积核的卷积运算操作,从而在不增加硬件成本的前提下提高硬件执行卷积神经网络运算的效率。
根据本申请的一个方面,提供了一种执行卷积运算操作的方法,包括:获取N个第二卷积核中的第n个第二卷积核,所述N个第二卷积核在相应维度上的尺寸之和与第一卷积核在相应维度上的尺寸相同,所述N个第二卷积核中的每一第二卷积核在相应维度上的尺寸小于或者等于计算单元在相应维度上的尺寸;基于第一卷积核在宽度和高度上的尺寸、与第一输入特征数据在宽度和高度上填充后的尺寸、所述第n个第二卷积核在宽度和高度上的尺寸、和所述第n个第二卷积核在所述第一卷积核中的宽度起点坐标和高度起点坐标,从所述填充后的第一输入特征数据中,获取与所述第n个第二卷积核对应的第二输入特征数据;由所述计算单元对与所述第n个第二卷积核对应的第二输入特征数据和所述第n个第二卷积核执行卷积运算操作,以获得与所述第n个第二卷积核对应的第二输出特征数据;以及在得到与所述N个第二卷积核对应的N个第二输出特征数据后,对所述N个第二输出特征数据进行整合,以获得与所述第一卷积核和所述第一输入特征数据对应的第一输出特征数据,其中,所述计算单元包括累加器和多个乘法器,用于对所述第二输入特征数据和所述第二卷积核进行卷积运算操作。
根据本申请的一个方面,提供了一种电子设备,包括:控制单元和计算单元,其中,所述控制单元配置为运行指令以控制所述计算单元执行上述执行卷积运算操作的方法。
根据本申请的一个方面,提供了一种执行卷积运算操作的装置,包括:第一获取模块,配置为获取N个第二卷积核中的第n个第二卷积核,所述N个第二卷积核在相应维度上的尺寸之和与第一卷积核在相应维度上的尺寸相同,所述N个第二卷积核中的每一第二卷积核在相应维度上的尺寸小于或者等于计算单元在相应维度上的尺寸;第二获取模块,配置为基于第一卷积核在宽度和高度上的尺寸、与第一输入特征数据在宽度和高度上填充后的尺寸、所述第n个第二卷积核在宽度和高度上的尺寸、和所述第n个第二卷积核在所述第一卷积核中的宽度起点坐标和高度起点坐标,从所述填充后的第一输入特征数据中,获取与所述第n个第二卷积核对应的第二输入特征数据;卷积计算模块,配置为利用所述计算单元对所述与所述第n个第二卷积核对应的第二输入特征数据和所述第n个第二卷积核执行卷积运算操作,以获得与所述第n个第二卷积核对应的第二输出特征数据;以及整合模块,配置为在得到与所述N个第二卷积核对应的N个第二输出特征数据后,对所述N个第二输出特征数据进行整合,以获得与所述第一卷积核和所述第一输入特征数据对应的第一输出特征数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京地平线机器人技术研发有限公司,未经北京地平线机器人技术研发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910190531.4/2.html,转载请声明来源钻瓜专利网。





