[发明专利]基于异构众核处理器的格点量子色动力学并行加速方法有效
申请号: | 201910750655.3 | 申请日: | 2019-08-14 |
公开(公告)号: | CN110516194B | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 栾钟治;张增校;杨海龙;王锐 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F17/16 | 分类号: | G06F17/16;G06F15/80 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 冀学军 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 异构众核 处理器 量子 动力学 并行 加速 方法 | ||
1.一种基于异构众核处理器的格点量子色动力学并行加速方法,其特征在于包括有下列步骤:
步骤一,异构众核处理器的从核矩阵位置初始化;
由于异构众核处理器中存在有多个从核,因此需要对从核按照从核标识号进行位置划分,并记录出每个从核的矩阵位置;
从核集CPEs={cpe1,cpe2,…,cpeA}按照8×8的矩阵进行位置排序,得到从核集位置矩阵addCPEs,任意一个从核位置记为dp,q:
步骤二,主核读取费米子场量和规范场量;
步骤201,主核MPE读取数据信息,将读取的所有数据信息以集合形式表达为SPM={S1,S2,…,Sg,…,SG};
步骤202,主核将所述的SPM={S1,S2,…,Sg,…,SG}数据信息中的费米子场量按读取的先后顺序存入一个8×8×8×8的格点矩阵DAAMPE中,并将DAAMPE保存到存储器中;
表示第一个数据信息S1在四维坐标点上的费米子场量值;表示S1的费米子场量;
表示第二个数据信息S2在四维坐标点上的费米子场量值;表示S2的费米子场量;
表示任意一个数据信息Sg在四维坐标点上的费米子场量值;表示Sg的费米子场量;
表示最后一个数据信息SG在四维坐标点上的费米子场量值;表示SG的费米子场量;
步骤203,主核将所述的SPM={S1,S2,…,Sg,…,SG}数据信息中的规范场量按读取的先后顺序存入一个4×8×8×8×8的格点链接矩阵DBBMPE中,并将DBBMPE保存到存储器中;
表示第一个数据信息S1在四维坐标点的方向上的规范场量值;表示S1在四维坐标点的方向;表示S1的规范场量;
表示第二个数据信息S2在四维坐标点的方向上的规范场量值;表示S2在四维坐标点的方向;表示S2的规范场量;
表示任意一个数据信息Sg在四维坐标点的方向上的规范场量值;表示Sg在四维坐标点的方向;表示Sg的规范场量;
表示最后一个数据信息SG在四维坐标点的方向上的规范场量值;表示SG在四维坐标点的方向;表示SG的规范场量;
步骤三,从核基于自身的行号列号读取数据信息实现数据分割;
步骤301,任意从核cpeA依据步骤一的从核矩阵位置dp,q,按照Z轴、T时间轴方向将DAAMPE矩阵中cpeA负责的数据信息部分读入局部存储空间,记为则所有从核读入的数据信息可记为:
步骤302,任意从核cpeA依据步骤一的从核矩阵位置dp,q,按照Z轴、T时间轴方向将DBBMPE矩阵中cpeA负责的数据信息部分读入局部存储空间,记为则所有从核读入的数据信息可记为:
步骤四,对任意一个从核中任意一个格点的数据信息进行运算;
步骤401,任意一个数据信息Sg的格点费米子场量记为执行步骤403;
步骤402,任意一个数据信息Sg的规范场量记为执行步骤403;
步骤403,从任意一个格点的数据信息Sg的x,y,z,t四个维度获取相邻8个格点的数据信息,然后获取相邻8个格点的格点费米子场量和规范子场量;执行步骤404;
相邻8个格点的数据信息分别记为S1、S2、S3、S4、S5、S6、S7和S8,位于相邻8个格点的中心格点是Sg,则格点费米子场量分别记为和所述Sg的格点费米子场量记为
则规范场量分别记为和
第一个数据信息S1的费米子场量记为
第一个数据信息S1的规范场量记为
第二个数据信息S2的费米子场量记为
第二个数据信息S2的规范场量记为
第三个数据信息S3的费米子场量记为
第三个数据信息S3的规范场量记为
第四个数据信息S4的费米子场量记为
第四个数据信息S4的规范场量记为
第五个数据信息S5的费米子场量记为
第五个数据信息S5的规范场量记为
第六个数据信息S6的费米子场量记为
第六个数据信息S6的规范场量记为
第七个数据信息S7的费米子场量记为
第七个数据信息S7的规范场量记为
第八个数据信息S8的费米子场量记为
第八个数据信息S8的规范场量记为
步骤404,将相邻8个格点的费米子场量和规范子场量进行矩阵相乘;执行步骤405;
步骤405,以相邻8个格点的矩阵相乘量更新中心格点是Sg的格点费米子场量,更新后属于Sg的格点费米子场量,记为且即中的数据信息Sg被更新为执行步骤五;
步骤五,每个从核对其局部存储空间中的每个格点的数据信息都进行步骤四的并行处理,从而得到更新后的所有格点的费米子场量,即获得执行步骤六;
步骤六,更新完成后,迭代次数加1;并计算格点费米子场量的残差值;
迭代次数记为U,最大迭代次数记为Umax,且Umax取值为1000,当前迭代次数记为U当前;若U当前<Umax,则执行步骤四;若U当前≥Umax,则执行步骤七;
格点费米子场量的残差记为R,格点费米子场量的残差阈值记为Rmin,且Rmin的取值为1.0×10-12;若R>Rmin,则执行步骤四;若R≤Rmin,则执行步骤七;
步骤七,将更新完成后的格点矩阵输出给存储器,作为文件保存;
将传给存储器,更新DAAMPE得到将保存并写入文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910750655.3/1.html,转载请声明来源钻瓜专利网。