[发明专利]神经网络加速方法、装置、神经网络加速芯片及存储介质在审
| 申请号: | 201910100514.7 | 申请日: | 2019-01-31 |
| 公开(公告)号: | CN109784484A | 公开(公告)日: | 2019-05-21 |
| 发明(设计)人: | 陈海波 | 申请(专利权)人: | 深兰科技(上海)有限公司 |
| 主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/04 |
| 代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
| 地址: | 200336 上海市长宁区威*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 神经网络 加速处理 加速芯片 存储介质 并行调度 加速效率 完成时 调度 | ||
1.一种神经网络加速方法,其特征在于,应用于神经网络加速芯片,该方法包括:
针对待加速的神经网络,进行下述步骤,直至确定所述神经网络加速完成:
采用待加速的当前层的参数对所述当前层进行加速处理,并调度所述当前层的下一层的参数;
当所述当前层加速处理完成时,将所述下一层确定为待加速的当前层进行加速处理。
2.如权利要求1所述的方法,其特征在于,如果所述待加速的当前层为最后一层,所述调度所述当前层的下一层的参数包括:
调度第一层的参数。
3.如权利要求1所述的方法,其特征在于,所述调度所述当前层的下一层的参数包括:
调度片上存储器中保存的所述当前层的下一层的参数。
4.如权利要求3所述的方法,其特征在于,所述调度片上存储器中保存的所述当前层的下一层的参数包括:
通过REG文件,调度片上存储器中保存的所述当前层的下一层的参数。
5.如权利要求3或4所述的方法,其特征在于,所述采用待加速的当前层的参数对所述当前层进行加速处理,并调度所述当前层的下一层的参数之前,所述方法还包括:
从待加速的神经网络中提取加速处理所需的每层的参数,并保存到所述片上存储器中。
6.如权利要求3或4所述的方法,其特征在于,所述片上存储器包括只读存储器ROM。
7.一种神经网络加速装置,其特征在于,应用于神经网络加速芯片,该装置包括:
加速调度模块,用于针对待加速的神经网络,进行下述步骤,直至确定所述神经网络加速完成:采用待加速的当前层的参数对所述当前层进行加速处理,并调度所述当前层的下一层的参数;
确定模块,用于当所述当前层加速处理完成时,将所述下一层确定为待加速的当前层进行加速处理。
8.如权利要求7所述的装置,其特征在于,所述加速调度模块,具体用于如果所述待加速的当前层为最后一层,调度第一层的参数。
9.如权利要求7所述的装置,其特征在于,所述加速调度模块,具体用于调度片上存储器中保存的所述当前层的下一层的参数。
10.如权利要求9所述的装置,其特征在于,所述加速调度模块,具体用于通过REG文件,调度片上存储器中保存的所述当前层的下一层的参数。
11.如权利要求9或10所述的装置,其特征在于,所述装置还包括:
提取保存模块,用于从待加速的神经网络中提取加速处理所需的每层的参数,并保存到所述片上存储器中。
12.如权利要求9或10所述的装置,其特征在于,所述片上存储器包括只读存储器ROM。
13.一种神经网络加速芯片,其特征在于,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
所述存储器中存储有计算机程序,当所述程序被所述处理器执行时,使得所述处理器执行权利要求1~6任一项所述方法的步骤。
14.一种计算机可读存储介质,其特征在于,其存储有可由神经网络加速芯片执行的计算机程序,当所述程序在所述神经网络加速芯片上运行时,使得所述神经网络加速芯片执行权利要求1~6任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深兰科技(上海)有限公司,未经深兰科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910100514.7/1.html,转载请声明来源钻瓜专利网。





