[发明专利]一种申威众核处理器的小规模对称矩阵并行三对角化方法有效

专利信息
申请号: 202110988799.X 申请日: 2021-08-26
公开(公告)号: CN113704691B 公开(公告)日: 2023-04-25
发明(设计)人: 刘芳芳;王鸿森 申请(专利权)人: 中国科学院软件研究所
主分类号: G06F17/16 分类号: G06F17/16
代理公司: 北京君尚知识产权代理有限公司 11200 代理人: 司立彬
地址: 100190 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 申威众核 处理器 小规模 对称 矩阵 并行 三对 角化 方法
【说明书】:

发明公开了一种申威众核处理器的小规模对称矩阵并行三对角化方法,其步骤包括:1)对待处理的对称矩阵进行二维划分,得到多个子块;每个从核负责处理一个对应子块;2)对于该从核组中的每一列从核,第i列从核对其LDM空间中存储的列数据进行householder变换,并计算参数tau及向量v;将向量v存储到第i列从核的每一从核LDM空间中,并调用swblas提供的列规约函数计算对应列向量的2范数;3)该从核组产生用于对该对称矩阵更新的向量w;4)该从核组根据向量w和向量v对该对称矩阵进行秩2更新;5)对该对称矩阵的每一列重复进行步骤2)到步骤4),完成该对称矩阵三对角化。

技术领域

本申请涉及申威众核处理器的稠密线性代数并行计算领域,具体涉及一种国产申威众核处理器的对称矩阵并行三对角化方法。

背景技术

对称矩阵的特征值、特征向量计算是稠密线性代数领域非常重要的核心计算之一,在第一性原理计算、量子模拟、人工智能等领域使用广泛。由于对称三对角矩阵具有很多非常好的性质,实际计算对称矩阵的特征值时往往先将对称矩阵化成对称三对角阵,然后使用二分法、QR迭代、分治法等算法求解特征值。对称矩阵三对角化在整个特征值计算中耗时较长,是并行和优化的重点。

对称矩阵三对角化sytd2是稠密线性代数领域著名的开源库LAPACK中一个子函数。通过householder变换将对称矩阵化成三对角矩阵。其通过调用LAPACK函数larfg计算householder变换的参数tau和向量v,通过调用BLAS库函数symv(对称矩阵向量乘)、syr2(对称矩阵秩2更新)、axpy(向量更新)、dot(向量点积)来进行矩阵更新。国产申威众核处理器上提供了并行版BLAS库swblas,其针对申威众核处理器的架构特点进行了并行和优化。sytd2可通过调用swblas来实现并行和加速。然而,该并行方式加速sytd2效果非常差。因为该方式需要重复加载数据到从核的局部存储器中,产生了大量的访存开销。提高sytd2的性能,可大幅减少对称矩阵求特征值的时间,对实际应用有重要的意义。

由于sytd2的重要性,国内外很多专家学者对其开展了深入的研究。有些工作通过对算法进行改进(将其约化改成两步,第一步先约化成带状对称矩阵,然后再约化成三对角矩阵)来改善其多核性能,有些研究面向多核平台、GPU加速卡的并行算法及优化方法,均取得了不错的效果。而在国产申威众核处理器上尚未出现该算法的并行和优化方法,本发明主要是填补此项空白。

国产申威众核处理器是由我国自主研制的一款高性能处理器,最新型号为39000,其采用主从异构架构,每个处理器节点由6个核组组成,每个核组包括1个主核和64个从核,从核以8*8阵列排布。每个从核可发起一个线程。最高可由64个线程同时进行计算。每个从核拥有256KB的私有LDM(Local Data Memory,局部数据存储器)空间,可通过DMA(直接存储器访问,Direct Memory Access)将数据从主存搬到LDM中。另外从核间可通过RMA(远端内存访问,Remote Memory Access)来进行数据传输。

发明内容

本发明的目的是提供一种国产申威众核处理器上小规模对称矩阵三对角化的并行和优化方法,以解决上述现有技术运行时间过长的问题,减少对称矩阵三对角化在国产申威众核处理器上的运行时间。在实际应用中,需要计算特征值的矩阵往往比较小,所以本发明主要面向小规模的矩阵来设计,具体规模大小以能全部装入从核LDM空间为限。

为实现上述目的,本发明提供了如下方案:

本发明提供一种国产申威众核处理器上小规模对称矩阵三对角化的并行和优化方法。为了方便描述,首先给出对称矩阵三对角化的原始算法(SYTD2):

for J=1to N-1do

对当前列产生householder变换因子tau和向量v(larfg)

产生用于矩阵更新的向量w(symv、dot、axpy)

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110988799.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top