[发明专利]一种申威众核处理器的小规模对称矩阵并行三对角化方法有效

专利信息
申请号: 202110988799.X 申请日: 2021-08-26
公开(公告)号: CN113704691B 公开(公告)日: 2023-04-25
发明(设计)人: 刘芳芳;王鸿森 申请(专利权)人: 中国科学院软件研究所
主分类号: G06F17/16 分类号: G06F17/16
代理公司: 北京君尚知识产权代理有限公司 11200 代理人: 司立彬
地址: 100190 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 申威众核 处理器 小规模 对称 矩阵 并行 三对 角化 方法
【权利要求书】:

1.一种申威众核处理器的小规模对称矩阵并行三对角化方法,其步骤包括:

1)对待处理的对称矩阵进行二维划分,得到多个子块;申威众核处理器的从核组中的每个从核负责处理一个对应子块;该从核组中的每列从核的LDM空间中存储该对称矩阵中的一列数据;

2)对于该从核组中的每一列从核,该从核组中的第i列从核对其LDM空间中存储的列数据进行householder变换,并计算参数tau及向量v;其中参数tau由larfg函数计算得到,向量v由第i列从核分别更新其所存储的子块数据得到;将所得向量v存储到第i列从核的每一从核LDM空间中,并调用swblas提供的列规约函数计算对应列向量的2范数;

3)该从核组产生用于对该对称矩阵更新的向量w;

4)该从核组根据向量w和向量v对该对称矩阵进行秩2更新;

5)对该对称矩阵的每一列重复进行步骤2)到步骤4),完成对该对称矩阵三对角化。

2.如权利要求1所述的方法,其特征在于,该从核组的所有从核通过一个共同的DMA操作将该对称矩阵的数据从主存拷贝到各自的LDM空间,每个从核拥有划分后的一个子块。

3.如权利要求1所述的方法,其特征在于,从核采用整块传输的方式获取对应子块。

4.如权利要求1或2或3所述的方法,其特征在于,步骤2)中,将参数tau通过RMA广播给该从核组的所有从核。

5.如权利要求1所述的方法,其特征在于,产生所述向量w的方法为:首先通过RMA将向量v传输给每个参与计算的从核;然后所有参与计算的从核分别根据向量v进行symv计算,得到向量y;然后该从核组的每一列从核分别通过dot计算该列从核中各从核所得向量y的部分和并对其进行规约后调用axpy完成向量w的更新。

6.如权利要求5所述的方法,其特征在于,对存储有有效数据的从核a设置两块缓冲区,分别用于存储从核a对其所存储子块与向量v的相乘结果a1、从核a对其所存储子块在该对称矩阵中的对称部分与向量v的相乘结果a2;然后将a1作为从核a对应的向量y,将a2传输给该对称部分对应的从核b作为从核b对应的向量y。

7.如权利要求5所述的方法,其特征在于,对该对称矩阵进行秩2更新的方法为:首先通过RMA将向量w和向量v传输给每个参与进行秩2更新的从核,然后由对角线及存储有有效数据的从核对该对称矩阵进行秩2更新。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110988799.X/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top