[发明专利]多核AI加速处理器的数据处理方法及结构在审
| 申请号: | 202111061730.9 | 申请日: | 2021-09-10 |
| 公开(公告)号: | CN115796233A | 公开(公告)日: | 2023-03-14 |
| 发明(设计)人: | 高伟;叶楠;徐旎林;闫夏超;王伟琪 | 申请(专利权)人: | 太初(无锡)电子科技有限公司 |
| 主分类号: | G06N3/0464 | 分类号: | G06N3/0464;G06N3/063;G06F15/16 |
| 代理公司: | 中国商标专利事务所有限公司 11234 | 代理人: | 张立晶 |
| 地址: | 214000 江苏省*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 多核 ai 加速 处理器 数据处理 方法 结构 | ||
1.一种多核AI加速处理器的数据处理方法,其特征在于,多核AI加速处理器具有多个核心,每个核心具有用户手动代码控制的片上高速缓存;核心之间设有核心总线,各个核心分别接入核心总线;核心之间数据传递方式为RMA广播通信,数据处理依序包括如下步骤:
S1、获取输入数据,所述输入数据包括:输入特征、输入权重;
S2、对输入特征或输入权重择一设置共享标记,作为共享数据;
S3、依据多核AI加速处理器的核心数量,将输入特征/输入权重拆分成多个输入特征块/输入权重块,将共享数据拆分成多个共享数据块,并对共享数据块编序;
S4、将共享数据根据编号均分给AI处理器的多个核心,每个核心根据分配的数据块编号分别获取相应的共享数据块,并存储至高速缓存中;
S5、每轮计算开始时,每个核心从主存中获取计算需要的输入特征块/输入权重块,持有本轮计算所需共享数据块编号的核心将共享数据块通过RMA的方式广播给所有的核心,然后进行计算;计算完成后,另一核心再将共享数据块广播到所有核心中,所有的核心在获得共享数据块之后,再次进行计算;直至所有共享数据块均完成广播和计算,输出部分计算结果;
S6、每个核心计算下一轮计算所需的输入特征块/输入权重块,以及共享数据块编号,重复S5过程;直至遍历完成所有的输入特征块/输入权重块。
2.如权利要求1所述的多核AI加速处理器的数据处理方法,其特征在于,步骤S2中,如果输入特征大于输入权重,则对输入权重设置共享标记;如果输入特征小于输入权重,则对输入特征设置共享标记。
3.如权利要求1所述的多核AI加速处理器的数据处理方法,其特征在于,步骤S3中,共享数据是平均拆分成多个共享数据块。
4.如权利要求3所述的多核AI加速处理器的数据处理方法,其特征在于,步骤S3中,共享数据拆分的数量与多核AI加速处理器的核心数量相等。
5.一种多核AI加速处理器的数据处理方法,其特征在于,多核AI加速处理器具有多个核心,每个核心具有用户手动代码控制的片上高速缓存;核心之间设有核心总线,各个核心分别接入核心总线;核心之间数据传递方式为RMA广播通信,数据处理依序包括如下步骤:
S1、获取输入数据,所述输入数据包括:输入特征、输入权重;
S2、依据计算顺序,将输入特征均匀拆分成多个输入特征块,并对输入特征块编序;依据计算顺序,将输入权重均匀拆分成多个输入权重块,并对输入权重块编序;输入特征块和输入权重块的数量与多核AI加速处理器的核心数量相等;
S3、多核AI加速处理器的每个核心分别获取1个输入特征块和1个输入权重块;输入特征块和输入权重块存储于核心的片上高速缓存;
S4、将共享数据根据编号均分给AI处理器的多个核心,每个核心根据分配的数据块编号分别获取相应的共享数据块,并存储至高速缓存中;
S5、每轮计算开始时,每个核心从主存中获取计算需要的输入特征块/输入权重块,持有本轮计算所需共享数据块编号的核心将共享数据块通过RMA的方式广播给所有的核心,然后进行计算;计算完成后,另一核心再将共享数据块广播到所有核心中,所有的核心在获得共享数据块之后,再次进行计算;直至所有共享数据块均完成广播和计算,输出部分计算结果;
S6、每个核心计算下一轮计算所需的输入特征块/输入权重块,以及共享数据块编号,重复S5过程;直至遍历完成所有的输入特征块/输入权重块。
6.如权利要求5所述的多核AI加速处理器的数据处理方法,其特征在于,步骤S4中,如果编序为1的输入特征块大于编序为1的输入权重块,则对编序为1的输入权重块设置共享标记;如果编序为1的输入特征块小于编序为1的输入权重块,则对编序为1的输入特征块设置共享标记。
7.一种多核AI加速处理器的数据处理装置,包括多个核心,每个核心分别与内存总线连接,核心通过内存总线获得输入数据,核心还通过内存总线输出计算结果;其特征在于,
每个核心具有用户手动代码控制的片上高速缓存;核心之间设有核心总线,各个核心分别接入核心总线;核心之间数据传递方式为RMA广播通信。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太初(无锡)电子科技有限公司,未经太初(无锡)电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111061730.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种螺旋给油中空电机轴
- 下一篇:气体探测器、蒸发器以及制冷系统





