[发明专利]一种针对卷积神经网络处理器的控制方法及装置在审
申请号: | 201810685989.2 | 申请日: | 2018-06-28 |
公开(公告)号: | CN108875925A | 公开(公告)日: | 2018-11-23 |
发明(设计)人: | 韩银和;许浩博;王颖 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06N3/063 | 分类号: | G06N3/063 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇;李科 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积计算单元 输入特征 卷积计算 卷积运算 卷积核 载入 周期数 卷积神经网络 处理器 卷积 填充 | ||
1.一种用于卷积神经网络处理器的控制方法,所述卷积神经网络处理器具有7*7的卷积计算单元,所述控制方法包括:
1)确定需要执行的卷积运算的卷积核尺寸n*n;
2)根据需要执行的卷积运算的卷积核尺寸n*n,选择在m2个7*7的卷积计算单元中载入与所述尺寸对应的卷积核的数值,并将其余的各个数值填充为0,7m≥n;
3)根据需要执行的卷积运算的尺寸、以及需要执行卷积的输入特征图的尺寸,确定卷积计算过程所需的周期数;并且
4)根据所述周期数,在卷积计算过程中的各个周期,将相应的输入特征图的数值载入到所述m2个7*7的卷积计算单元中,所述输入特征图的数值在所述m2个7*7的卷积计算单元中的分布与所述卷积核的数值在所述m2个7*7的卷积计算单元中的分布保持一致;
控制载入了卷积核以及输入特征图的数值的所述m2个7*7的卷积计算单元分别执行与所述周期数对应的卷积计算;
5)对所述m2个7*7的卷积计算单元的卷积计算结果中对应的元素进行累加,以获得最终的卷积运算的输出特征图。
2.根据权利要求1所述的方法,其中步骤2)包括:
若是需要执行的卷积运算的尺寸小于7*7,则在同一个7*7的卷积计算单元中载入与所述尺寸对应的卷积核的数值并将其余的各个数值填充为0;
若是需要执行的卷积运算的尺寸大于7*7,则在相应数量的7*7的卷积计算单元中载入与所述尺寸对应的卷积核的数值并将其余的各个数值填充为0。
3.根据权利要求1所述的方法,其中步骤4)包括:
在卷积计算过程中的各个周期中,若是需要载入的输入特征图的数值中包含所述输入特征图中左侧第一列的元素,则一次性将所述输入特征图中与需要执行的卷积运算的尺寸相匹配的多个元素载入到所述卷积计算单元的相应位置处并将其余的各个位置的数值填充为0,否则则将与前一周期中相同的元素作为一个整体向左移动一个单元,并且将输入特征图中与前一周期中不同的、且需要更新的多个元素载入到通过所述移动而空出的位置处。
4.根据权利要求1所述的方法,其中步骤4)包括:
在卷积计算过程中的各个周期中,控制所述m2个7*7的卷积计算单元分别对其所载入的针对输入特征图以及针对卷积核的对应位置的元素执行乘法、并对乘法的结果进行累加,以获得输出特征图中相应位置的元素。
5.根据权利要求1-4中任意一项所述的方法,其中步骤2)包括:
若是需要执行的卷积运算的尺寸为5*5,则在同一个7*7的卷积计算单元中载入5*5的卷积核的数值并将其余的各个数值填充为0;
并且,步骤4)包括:
在执行卷积计算的全部周期的每一个周期,将相应的输入特征图的数值载入到所述7*7的卷积计算单元中,所述输入特征图的数值在所述7*7的卷积计算单元中的分布与所述5*5的卷积核的数值在所述7*7的卷积计算单元中的分布保持一致;
其中,在卷积计算过程中的各个周期中,若是需要载入的输入特征图的数值中包含所述输入特征图中左侧第一列的元素,则一次性将所述输入特征图中尺寸为5*5的25个元素载入到所述卷积计算单元的相应位置处并将其余的各个位置的数值填充为0,否则则将与前一周期中相同的元素作为一个整体向左移动一个单元,并且将输入特征图中与前一周期中不同的、且需要更新的5个元素载入到通过所述移动而空出的位置处。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810685989.2/1.html,转载请声明来源钻瓜专利网。