[发明专利]一种基于GPGPU可重构架构的方法及计算系统有效
申请号: | 202110616126.1 | 申请日: | 2021-06-03 |
公开(公告)号: | CN113076521B | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | 李颖 | 申请(专利权)人: | 沐曦集成电路(上海)有限公司 |
主分类号: | G06F17/16 | 分类号: | G06F17/16;G06F17/15;G06N3/04;G06N3/063;G06N3/08;G06T1/20 |
代理公司: | 上海双诚知识产权代理事务所(普通合伙) 31423 | 代理人: | 方玉 |
地址: | 201204 上海市浦东*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gpgpu 构架 方法 计算 系统 | ||
1.一种基于GPGPU可重构架构的方法,其特征在于,包括:
根据计算中矩阵乘法或卷积运算的参与程度,选择架构模式,其中,所述架构模式包括通用图形处理器模式和混合脉动阵列模式;
当计算中矩阵乘法的参与程度高时,选择通用图形处理器模式;
当计算中卷积运算的参与程度高时,选择混合脉动阵列模式;
当选择通用图形处理器模式时,计算系统中的寄存器被配置为以通用图形处理器的通用矩阵乘法方式进行数据存取与运算;
当选择混合脉动阵列模式时,计算系统中的寄存器被配置为以混合脉动阵列的直接卷积方式进行数据存取与运算;
所述混合脉动阵列为:将不同计算单元间计算结果进行累加的脉动阵列,与将每个计算单元计算结果进行累加的GPGPU的混合。
2.根据权利要求1所述的方法,其特征在于,所述方法进一步包括:
当所选择的架构模式与计算系统当前所采用的架构模式不同时,对架构模式进行切换。
3.根据权利要求2所述的方法,其特征在于,所述的对架构模式进行切换进一步包括:
等待之前未执行完的计算任务完成并刷新缓存完成后,将所述计算系统中的寄存器从当前所采用的架构模式重新配置为所选择的架构模式;
模式重构完成后,开始接受新的计算任务。
4.根据权利要求1所述的方法,其特征在于,所述计算系统中的寄存器被配置为多个计算单元,每个计算单元被配置为同时完成一个或多个乘法运算并将乘法运算的结果相加得到每个计算单元的计算结果。
5.根据权利要求4所述的方法,其特征在于,每个计算单元被配置为同时完成最多8个乘法运算并将乘法运算的结果相加得到每个计算单元的计算结果。
6.根据权利要求4所述的方法,其特征在于,在所述通用图形处理器模式下,各个计算单元的计算结果通过指令进行组合或累加。
7.根据权利要求4所述的方法,其特征在于,在所述混合脉动阵列模式下,对于一维卷积操作:
将卷积核数据的m个元素固定于计算单元中,使输入数据的n个元素按时钟周期依次滑动进入计算单元,其中,m、n为自然数且m≤n;
在每个时钟周期,使卷积核数据的m个元素分别一一对应于输入数据的n个元素中的m个数据,使卷积核数据的m个元素与滑动到计算单元中对应位置上的输入数据的对应的m个元素分别进行乘法运算并将乘积相加,存为当前时钟周期的计算结果;
依次输出每个时钟周期的计算结果,得到n-m+1个计算结果,作为输出数据的n-m+1个元素。
8.根据权利要求7所述的方法,其特征在于,在所述混合脉动阵列模式下,对于二维卷积操作:
对于m行m列的卷积核矩阵和nr行nc列的输入矩阵,输出矩阵为nr-m+1行nc-m+1列的矩阵,nr、nc为自然数且m≤nr,m≤nc;
使卷积核矩阵的m行元素的每一行分别与输入矩阵的第i到i+m行元素中的对应一行进行m次一维卷积操作,得到m个数据行,每个数据行有nc-m+1个元素,将m个数据行上的对应元素累加,得到输出矩阵的第i行的nc-m+1个元素,其中i=1, 2, ..., nr-m+1。
9.根据权利要求8所述的方法,其特征在于,在所述混合脉动阵列模式下,对于二维卷积操作:
将计算单元组成计算单元阵列。
10.根据权利要求9所述的方法,其特征在于,在所述混合脉动阵列模式下,对于二维卷积操作:
所述计算单元阵列为m行(nr-m+1)列的计算单元阵列,其中第i列计算单元用于得到输出矩阵的第i行的运算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沐曦集成电路(上海)有限公司,未经沐曦集成电路(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110616126.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于无人机影像的DSM生成方法和装置
- 下一篇:一种全自动细胞生产线