[发明专利]面向深度学习的粗粒度可重构阵列仿真器系统和计算方法在审
申请号: | 202310103775.0 | 申请日: | 2023-01-28 |
公开(公告)号: | CN116187434A | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 白雪飞;赵高飞;陈松;康一 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06N3/10 | 分类号: | G06N3/10 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吴梦圆 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 深度 学习 粒度 可重构 阵列 仿真器 系统 计算方法 | ||
1.一种面向深度学习的粗粒度可重构阵列仿真器系统,包括:
存储模块,用于存储初始图数据;
数据调度模块,用于存储包括多个指令的指令集,以及使所述存储模块根据所述指令集将所述初始图数据传输至可重构阵列中;
可重构阵列,用于接收所述初始图数据,以及根据深度学习模型的网络层的计算类型,调用图形处理器对所述初始图数据进行并行计算得到输出结果。
2.根据权利要求1所述的系统,其中,所述可重构阵列包括:
第一处理单元,用于在所述深度学习模型的所述网络层的计算类型为线性计算类型的情况下,接收所述初始图数据以及调用所述图形处理器对所述初始图数据进行并行计算得到第一子输出结果;
第二处理单元,用于在所述深度学习模型的所述网络层的计算类型为非线性类型的的情况下,接收所述初始图数据以及对所述初始图数据进行计算得到第二子输出结果,以及基于所述第一子输出结果和所述第二子输出结果,得到所述输出结果。
3.根据权利要求2所述的系统,其中,所述第一处理单元包括:
第一子处理单元,用于在所述深度学习模型的网络层的计算类型为线性计算类型的情况下,接收所述初始图数据,将所述初始图数据传输至中央处理器;
第二子处理单元,用于利用所述中央处理器将所述初始图数据传输至所述图形处理器,以及利用所述图形处理器根据所述初始图数据调用指定数量的线程对所述初始图数据进行并行计算得到第一子输出结果。
4.根据权利要求1所述的系统,其中,所述存储模块包括:
第一存储单元,用于存储特征图数据;
第二存储单元,用于根据所述可重构阵列的容量,对所述特征图数据从多个维度进行切分,得到所述初始图数据。
5.根据权利要求4所述的系统,其中,所述第二存储单元包括:
第一子存储单元,用于根据所述可重构阵列的容量,按照高维度和宽维度对所述特征图数据进行切分,得到初始图数据;或
第二存储子单元,用于根据所述可重构阵列的容量,按照高维度、宽维度和通道维度对所述特征图数据进行切分,得到初始图数据。
6.根据权利要求5所述的系统,其中,所述第一处理单元还包括:
第三处理子单元,用于根据所述初始图数据在所述存储单元中的第一存储位置,确定所述初始图数据在所述图形处理器的第二存储位置;
第四处理子单元,用于根据所述第二存储位置,调用指定数量的线程对所述初始图数据进行并行计算得到第一子输出结果。
7.根据权利要求1所述的系统,其中,所述存储模块还用于接收所述输出结果,在确定所述深度学习模型的网络层未计算完的情况下,将所述输出结果作为特征图数据。
8.根据权利要求1所述的系统,其中,所述存储模块还用于接收所述输出结果,在确定所述深度学习模型的网络层均计算完的情况下,输出所述输出结果。
9.根据权利要求1所述的系统,还包括:
接口模块,用于在所述系统包括多个的情况下,在多个所述系统之间传输所述输出结果。
10.一种面向深度学习的粗粒度可重构阵列仿真器计算方法,包括:
利用存储模块存储初始图数据;
利用数据调度模块存储包括多个指令的指令集,以及使所述存储模块根据所述指令集将所述初始图数据传输至可重构阵列中;
利用可重构阵列接收所述初始图数据,以及根据深度学习模型的网络层的计算类型,调用图形处理器对所述初始图数据进行并行计算得到输出结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310103775.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:循环流化床锅炉
- 下一篇:气体储能用储气罐及其系统