[发明专利]执行卷积运算操作的方法及装置、生成指令的方法及装置有效
| 申请号: | 201910190531.4 | 申请日: | 2019-03-13 |
| 公开(公告)号: | CN109656623B | 公开(公告)日: | 2019-06-14 |
| 发明(设计)人: | 李智超;王振江;凌坤;李建军 | 申请(专利权)人: | 北京地平线机器人技术研发有限公司 |
| 主分类号: | G06F9/302 | 分类号: | G06F9/302;G06N3/04;G06N3/063 |
| 代理公司: | 北京市正见永申律师事务所 11497 | 代理人: | 黄小临;冯玉清 |
| 地址: | 100080 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 公开了一种执行卷积运算操作的方法及装置、生成指令的方法及装置,该执行卷积运算操作的方法包括:获取第n个第二卷积核;基于第一卷积核在宽度和高度上的尺寸、与第一输入特征数据在宽度和高度上填充后的尺寸、第n个第二卷积核在宽度和高度上的尺寸、和第n个第二卷积核在第一卷积核中的宽度起点坐标和高度起点坐标,从填充后的第一输入特征数据中,获取与第n个第二卷积核对应的第二输入特征数据;对与第n个第二卷积核对应的第二输入特征数据和第n个第二卷积核执行卷积运算操作;以及在得到N个第二输出特征数据后,对N个第二输出特征数据进行整合。本申请能够在不增加硬件成本的前提下提高硬件执行卷积神经网络运算的效率。 | ||
| 搜索关键词: | 卷积核 卷积运算 输入特征 起点坐标 生成指令 输出特征 卷积 填充 核对 卷积神经网络 硬件成本 硬件执行 整合 运算 申请 | ||
【主权项】:
1.一种利用计算单元执行卷积运算操作的方法,所述计算单元是用于执行神经网络计算的硬件,并且包括多个乘法器和累加器,所述方法包括:获取N个第二卷积核中的第n个第二卷积核,所述N个第二卷积核在相应维度上的尺寸之和与第一卷积核在相应维度上的尺寸相同,所述计算单元中包括的乘法器的数量小于用于直接执行所述第一卷积核的卷积运算操作所需的乘法器的数量,并且大于或等于用于直接执行所述N个第二卷积核中的每一第二卷积核的卷积运算操作所需的乘法器的数量;基于所述第一卷积核在宽度和高度上的尺寸、与第一输入特征数据在宽度和高度上填充后的尺寸、所述第n个第二卷积核在宽度和高度上的尺寸、和所述第n个第二卷积核在所述第一卷积核中的宽度起点坐标和高度起点坐标,从填充后的所述第一输入特征数据中,获取与所述第n个第二卷积核对应的第二输入特征数据;由所述计算单元对与所述第n个第二卷积核对应的第二输入特征数据和所述第n个第二卷积核执行卷积运算操作,以获得与所述第n个第二卷积核对应的第二输出特征数据;以及在得到与所述N个第二卷积核对应的N个第二输出特征数据后,对所述N个第二输出特征数据进行整合,以获得与所述第一卷积核和所述第一输入特征数据对应的第一输出特征数据。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京地平线机器人技术研发有限公司,未经北京地平线机器人技术研发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910190531.4/,转载请声明来源钻瓜专利网。





