[发明专利]面向深度学习的粗粒度可重构阵列仿真器系统和计算方法在审
申请号: | 202310103775.0 | 申请日: | 2023-01-28 |
公开(公告)号: | CN116187434A | 公开(公告)日: | 2023-05-30 |
发明(设计)人: | 白雪飞;赵高飞;陈松;康一 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06N3/10 | 分类号: | G06N3/10 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 吴梦圆 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 深度 学习 粒度 可重构 阵列 仿真器 系统 计算方法 | ||
本公开提供了一种面向深度学习的粗粒度可重构阵列仿真器系统和计算方法,可以应用于深度学习技术领域以及可重构阵列技术领域。该面向深度学习的粗粒度可重构阵列仿真器系统包括:存储模块,用于存储初始图数据;数据调度模块,用于存储包括多个指令的指令集,以及使存储模块根据指令集将初始图数据传输至可重构阵列中;可重构阵列,用于接收初始图数据,以及根据深度学习模型的网络层的计算类型,调用图形处理器对初始图数据进行并行计算得到输出结果。
技术领域
本公开涉及深度学习技术领域以及可重构阵列技术领域,更具体地,涉及一种面向深度学习的粗粒度可重构阵列仿真器系统和计算方法。
背景技术
粗粒度可重构阵列具有较好的灵活性和计算能效。在大规模片上系统((Systemon Chip,SOC)设计的前期,利用粗粒度可重构阵列仿真器进行设计能够降低芯片开发成本,并且可以减少芯片开发周期,后期可以与寄存器转换级(Register Transfer Level,RTL)模型进行联合仿真,验证仿真结果正确性。
在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题:相关技术中,在面对大规模数据处理的情况下,需要耗费大量时间,导致数据处理的效率较低。
发明内容
有鉴于此,本公开提供了一种面向深度学习的粗粒度可重构阵列仿真器系统和计算方法。
本公开的一个方面提供了一种面向深度学习的粗粒度可重构阵列仿真器系统,包括:
存储模块,用于存储初始图数据;
数据调度模块,用于存储包括多个指令的指令集,以及使存储模块根据指令集将初始图数据传输至可重构阵列中;
可重构阵列,用于接收初始图数据,以及根据深度学习模型的网络层的计算类型,调用图形处理器对初始图数据进行并行计算得到输出结果。
根据本公开的实施例,其中,可重构阵列包括:
第一处理单元,用于在深度学习模型的网络层的计算类型为线性计算类型的情况下,接收初始图数据以及调用图形处理器对初始图数据进行并行计算得到第一子输出结果;
第二处理单元,用于在深度学习模型的网络层的计算类型为非线性类型的的情况下,接收初始图数据以及对初始图数据进行计算得到第二子输出结果,以及基于第一子输出结果和第二子输出结果,得到输出结果。
根据本公开的实施例,其中,第一处理单元包括:
第一子处理单元,用于在深度学习模型的网络层的计算类型为线性计算类型的情况下,接收初始图数据,将初始图数据传输至中央处理器;
第二子处理单元,用于利用中央处理器将初始图数据传输至图形处理器,以及利用图形处理器根据初始图数据调用指定数量的线程对初始图数据进行并行计算得到第一子输出结果。
根据本公开的实施例,其中,存储模块包括:
第一存储单元,用于存储特征图数据;
第二存储单元,用于根据可重构阵列的容量,对特征图数据从多个维度进行切分,得到初始图数据。
根据本公开的实施例,其中,第二存储单元包括:
第一子存储单元,用于根据可重构阵列的容量,按照高维度和宽维度对特征图数据进行切分,得到初始图数据;或
第二存储子单元,用于根据可重构阵列的容量,按照高维度、宽维度和通道维度对特征图数据进行切分,得到初始图数据。
根据本公开的实施例,其中,第一处理单元还包括:
第三处理子单元,用于根据初始图数据在存储单元中的第一存储位置,确定初始图数据在图形处理器的第二存储位置;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310103775.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:循环流化床锅炉
- 下一篇:气体储能用储气罐及其系统