[发明专利]基于脉冲阵列的卷积神经网络优化方法及装置有效
申请号: | 201911100653.6 | 申请日: | 2019-11-12 |
公开(公告)号: | CN110852422B | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 谭婧炜佳;马茂棣;阎凯歌 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 林哲生 |
地址: | 130000 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 脉冲 阵列 卷积 神经网络 优化 方法 装置 | ||
本发明提供基于脉冲阵列的卷积神经网络优化方法及装置,以提高参与计算的所有PE中最低的最高运行频率。上述卷积神经网络包括至少一层卷积层;卷积层包括至少一组过滤器;任一卷积层执行的卷积操作包括:使用过滤器在输入激活矩阵上进行扫描;脉冲阵列用于执行每一卷积层所涉及的卷积计算,脉冲阵列包括N行M列处理单元PE;其中,参与卷积计算的任一PE的寄存器,用于存储相应过滤器的权重值;方法包括:确定处理本层卷积层的卷积操作的初始PE运算阵列;初始PE运算阵列包括行数n和列数m;其中,n小于等于N,m小于等于M;将初始PE运算阵列中最高运行频率最低的PE进行替换,以得到优化后的PE运算阵列。
技术领域
本发明涉及计算机领域,特别涉及基于脉冲阵列的卷积神经网络优化方法及装置。
背景技术
CNN(卷积神经网络,ConvolutionNeuralNetwork)是现阶段最受欢迎的图像处理方式之一。CNN计算过程中占比最大、耗时最长的操作即为卷积(Convolution)。
脉冲阵列可以高效地计算大量矩阵点乘,而矩阵点乘是卷积操作的主要计算模式。脉冲阵列由大量处理单元(ProcessingElement,PE)组成,所有PE必须工作在相同频率下。
然而受工艺技术的限制,众多PE的物理参数无法保证严格一致,而是呈正态分布,这使得脉冲阵列内各PE的最高工作频率无法严格一致。因此,为保证计算结果的正确性,脉冲阵列的整体运行频率将受限于所有PE中最低的最高运行频率,以避免部分PE无法在时钟周期内完成工作进而输出错误结果。
发明内容
有鉴于此,本发明提供基于脉冲阵列的卷积神经网络优化方法及装置,以提高参与计算的所有PE中最低的最高运行频率。
为了实现上述发明目的,本发明提供以下技术方案:
一种基于脉冲阵列的卷积神经网络优化方法,所述卷积神经网络包括至少一层卷积层;所述卷积层包括至少一组过滤器;任一卷积层执行的卷积操作包括:使用过滤器在输入激活矩阵上进行扫描,其中,所述过滤器每扫描到所述输入激活矩阵的一个位置就使用所述过滤器的权重进行一次矩阵点乘计算,得到输出激活矩阵中的一个元素;
所述脉冲阵列用于执行每一卷积层所涉及的矩阵点乘计算,所述脉冲阵列包括N行M列处理单元PE;其中,参与矩阵点乘计算的任一PE的寄存器,用于存储相应过滤器的权重值;
所述方法包括:
确定处理本层卷积层的卷积操作的初始PE运算阵列;所述初始PE运算阵列包括行数n和列数m;其中,n小于等于N,m小于等于M;
将所述初始PE运算阵列中最高运行频率最低的PE进行替换,以得到优化后的PE运算阵列。
可选的,所述将所述初始PE运算阵列中最高运行频率最低的PE进行替换包括:确定所述脉冲阵列中的冗余PE行和冗余PE列;对所述初始PE执行冗余替换,得到冗余优化后的PE运算阵列;其中,所述执行冗余替换包括:执行至少一次的冗余行替换操作,以及,执行至少一次的冗余列替换操作中的至少一种。
可选的,所述将所述初始PE运算阵列中最高运行频率最低的PE进行替换包括:确定用于替换目标替换PE的至少一个PE;所述目标替换PE为所述初始PE运算阵列或者所述冗余优化后的PE运算阵列中最高运行频率最低的PE;对所述目标替换PE对应的权重进行权重转移;禁用所述目标替换PE,以令所述目标替换PE不执行乘加运算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911100653.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于云文档管理系统的知识库构建平台
- 下一篇:一种高空抛物预警方法和装置