[发明专利]一种基于分布式权值存储加速神经网络计算的架构及方法有效
申请号: | 202010079399.2 | 申请日: | 2020-02-03 |
公开(公告)号: | CN111275179B | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 邹晓峰;李拓;刘同强;周玉龙;王朝辉;李仁刚 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063 |
代理公司: | 济南诚智商标专利事务所有限公司 37105 | 代理人: | 黄晓燕 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分布式 存储 加速 神经网络 计算 架构 方法 | ||
1.一种基于分布式权值存储加速神经网络计算的架构,其特征是,所述架构包括:主处理器系统、分布式权值存储计算模块和目标加速神经网络;
所述主处理器系统用于运行系统程序,并加载分布式权值存储计算阵列的驱动程序,通过驱动将指令派发到MEM-PE单元的各处理器核,并将MEM-PE单元计算的最终结果返回主程序或目标加速神经网络;
所述分布式权值存储计算模块基于所述驱动程序,将权值存储空间按照阵列进行划分,形成分布式存储计算单元阵列,并为每个分布式存储计算单元配置处理器核,形成MEM-PE单元;所述MEM-PE单元用于根据计算指令,本地加载权值进行计算,对中间计算结果进行分布式存储;所述中间结果根据神经网络的计算结构,存储至其他处理器核的存储器中;
所述目标加速神经网络通过DMA与分布式权值存储阵列互联,通过RoCC接口连接主处理器系统,所述目标加速神经网络的神经网络算法运行在主处理器系统上。
2.根据权利要求1所述的基于分布式权值存储加速神经网络计算的架构,其特征是,所述分布式存储计算单元包括指令存储器,所述指令存储器用于存储计算指令。
3.根据权利要求2所述的基于分布式权值存储加速神经网络计算的架构,其特征是,所述处理器核包括DMA、内存控制器和分布式存储器,所述DMA用于MEM-PE单元的互连,所述内存控制器基于异构远程存储编辑模型,用于指定数据的存储位置,所述分布式存储器用于存储初始权值和/或中间计算结果。
4.根据权利要求3所述的基于分布式权值存储加速神经网络计算的架构,其特征是,所述分布式存储器包含全局地址和局部地址,所述全局地址由处理器编址,所述局部地址由当前分布式存储器对应的处理器核编址。
5.根据权利要求1所述基于分布式权值存储加速神经网络计算的架构,其特征是,所述分布式权值存储计算模块还包括RoCC接口,所述RoCC接口通过2DMesh实现MEM-PE单元向外互连。
6.根据权利要求1所述基于分布式权值存储加速神经网络计算的架构,其特征是,所述主处理器系统包括DDR、主处理器和MEM_IF接口,所述DDR用于挂载主处理器的内存,运行操作系统和神经网络应用程序;所述MEM_IF接口为向外互连接口。
7.一种设计方法,基于权利要求1-6任一项所述的基于分布式权值存储加速神经网络计算的架构,其特征是,所述设计方法包括以下步骤:
构建主处理器系统;
划分分布式权值存储阵列,主处理器将权值存储空间进行编址,按照阵列结构划分成若干分布式存储计算单元;
生成处理器核,为每个分布式存储计算单元配置处理器核,形成MEM-PE单元;
构建目标加速神经网络,将神经网络各结构层的计算所需的存取和访存接口提取,通过通信接口与MEM-PE单元互连。
8.一种基于分布式权值存储的神经网络计算方法,基于权利要求1-6任一项所述的基于分布式权值存储加速神经网络计算的架构,其特征是,所述计算方法包括:
根据神经网络的计算程序,划定初始权值的分布式存储计算单元;
在神经网络的访存计算过程中,根据主处理器下发的计算指令在分布式存储计算单元内进行计算,并将中间计算结果存储在本地分布式存储计算单元内或阵列中的其它分布式存储计算单元内;
主处理器将最终的计算结果返回目标神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010079399.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:无监督异常检测系统和方法
- 下一篇:数据处理方法、装置、设备及存储介质