[发明专利]一种申威众核处理器的小规模对称矩阵并行三对角化方法有效
申请号: | 202110988799.X | 申请日: | 2021-08-26 |
公开(公告)号: | CN113704691B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 刘芳芳;王鸿森 | 申请(专利权)人: | 中国科学院软件研究所 |
主分类号: | G06F17/16 | 分类号: | G06F17/16 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 司立彬 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 申威众核 处理器 小规模 对称 矩阵 并行 三对 角化 方法 | ||
1.一种申威众核处理器的小规模对称矩阵并行三对角化方法,其步骤包括:
1)对待处理的对称矩阵进行二维划分,得到多个子块;申威众核处理器的从核组中的每个从核负责处理一个对应子块;该从核组中的每列从核的LDM空间中存储该对称矩阵中的一列数据;
2)对于该从核组中的每一列从核,该从核组中的第i列从核对其LDM空间中存储的列数据进行householder变换,并计算参数tau及向量v;其中参数tau由larfg函数计算得到,向量v由第i列从核分别更新其所存储的子块数据得到;将所得向量v存储到第i列从核的每一从核LDM空间中,并调用swblas提供的列规约函数计算对应列向量的2范数;
3)该从核组产生用于对该对称矩阵更新的向量w;
4)该从核组根据向量w和向量v对该对称矩阵进行秩2更新;
5)对该对称矩阵的每一列重复进行步骤2)到步骤4),完成对该对称矩阵三对角化。
2.如权利要求1所述的方法,其特征在于,该从核组的所有从核通过一个共同的DMA操作将该对称矩阵的数据从主存拷贝到各自的LDM空间,每个从核拥有划分后的一个子块。
3.如权利要求1所述的方法,其特征在于,从核采用整块传输的方式获取对应子块。
4.如权利要求1或2或3所述的方法,其特征在于,步骤2)中,将参数tau通过RMA广播给该从核组的所有从核。
5.如权利要求1所述的方法,其特征在于,产生所述向量w的方法为:首先通过RMA将向量v传输给每个参与计算的从核;然后所有参与计算的从核分别根据向量v进行symv计算,得到向量y;然后该从核组的每一列从核分别通过dot计算该列从核中各从核所得向量y的部分和并对其进行规约后调用axpy完成向量w的更新。
6.如权利要求5所述的方法,其特征在于,对存储有有效数据的从核a设置两块缓冲区,分别用于存储从核a对其所存储子块与向量v的相乘结果a1、从核a对其所存储子块在该对称矩阵中的对称部分与向量v的相乘结果a2;然后将a1作为从核a对应的向量y,将a2传输给该对称部分对应的从核b作为从核b对应的向量y。
7.如权利要求5所述的方法,其特征在于,对该对称矩阵进行秩2更新的方法为:首先通过RMA将向量w和向量v传输给每个参与进行秩2更新的从核,然后由对角线及存储有有效数据的从核对该对称矩阵进行秩2更新。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110988799.X/1.html,转载请声明来源钻瓜专利网。