[发明专利]面向众核架构的稀疏矩阵向量乘众核优化方法在审
| 申请号: | 201910919675.9 | 申请日: | 2019-09-26 | 
| 公开(公告)号: | CN112560356A | 公开(公告)日: | 2021-03-26 | 
| 发明(设计)人: | 郭恒;陈鑫;刘鑫;陈德训;李芳;徐金秀;孙唯哲 | 申请(专利权)人: | 无锡江南计算技术研究所 | 
| 主分类号: | G06F30/28 | 分类号: | G06F30/28;G06F113/08;G06F119/14 | 
| 代理公司: | 苏州创元专利商标事务所有限公司 32103 | 代理人: | 王健 | 
| 地址: | 214083 江苏*** | 国省代码: | 江苏;32 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 面向 架构 稀疏 矩阵 向量 乘众核 优化 方法 | ||
本发明公开了种面向众核架构的稀疏矩阵向量乘众核优化方法,包括以下步骤:S1、已知:行数为m,列数为n的稀疏矩阵A,长为n的向量x;求解长度为m的向量y,y=Ax为稀疏矩阵A与向量x的点积;S1、定义x向量块大小blk_x_size,根据x向量元素下标对x向量元素进行分块将x向量进行分块;S2、根据x向量的分块信息,即S1中求解得到的x向量元素所在的x向量块编号信息,统计原始稀疏矩阵即稀疏矩阵A中每一行非零元所在列号对应的x向量块的编号,由此统计出稀疏矩阵向量乘时稀疏矩阵每一行所需要的x向量块的编号信息。本发明提高了整体众核加速性能,提高数据访问的局部性,对非结构网格CFD应用的优化作用明显。
技术领域
本发明属于稀疏矩阵向量乘技术领域,尤其涉及一种面向众核架构的稀疏 矩阵向量乘众核优化方法。
背景技术
随着非结构网格CFD应用研究的不断深入以及超级计算机技术的飞速发 展,稀疏矩阵向量乘的众核加速成为了CFD应用优化研究的重点之一。
由于非结构网格CFD应用产生的稀疏矩阵非零元分布松散,不同非零元编 号跨度大,导致程序的计算核心之一——稀疏矩阵向量乘(Spmv)有着十分明 显的离散访存问题,这也成为了非机构网格CFD应用众核优化的一个难点。
随着网格规模增大,稀疏矩阵向量乘中离散访存问题愈发明显,给CFD应 用性能带来较大的性能损失,有时甚至会成为整个应用的主要瓶颈。为了解决 稀疏矩阵向量乘众核优化问题,针对非机构网格CFD应用特征,需要充分利用 非结构网格CFD应用稀疏矩阵性质,提出更加明确细致的众核优化算法,提升 程序整体性能。
对于稀疏矩阵向量乘的众核优化问题,传统的做法是对原始稀疏矩阵按照 合适的大小进行行列分块,每一个加速核负责一部分矩阵块数据的计算。该方 法可以有效减轻稀疏矩阵向量乘中的离散访存问题,但是,非结构网格CFD应 用中产生的稀疏矩阵往往极度稀疏(稀疏矩阵每一行往往只有几个非零元素) 且非零元的分布具有一定统计规律。由于矩阵极为稀疏,所以传统的固定宽度 行列分块做法会出现非常严重的负载均衡问题,且无法有效利用CPU与众核协 处理器之间的数据传输带宽,导致针对CFD应用的Spmv众核优化效果不佳。
发明内容
本发明目的在于提供一种面向众核架构的稀疏矩阵向量乘众核优化方法, 该稀疏矩阵向量乘众核优化方法极大提高数据访问的局部性,有效利用CPU与 众核协处理器之间的数据传输带宽,对非结构网格CFD应用的优化作用明显。
为达到上述目的,本发明采用的技术方案是:一种面向众核架构的稀疏矩 阵向量乘众核优化方法,包括以下步骤:
S1、已知:行数为m,列数为n的稀疏矩阵A,长为n的向量x;求解长度 为m的向量y,y=Ax为稀疏矩阵A与向量x的点积;
S1、定义x向量块大小blk_x_size,根据x向量元素下标对x向量元素进行 分块将x向量进行分块;
S2、根据x向量的分块信息,即S1中求解得到的x向量元素所在的x向量 块编号信息,统计原始稀疏矩阵即稀疏矩阵A中每一行非零元所在列号对应的 x向量块的编号,由此统计出稀疏矩阵向量乘时稀疏矩阵每一行所需要的x向量 块的编号信息;
S3、合并在稀疏矩阵向量乘中需求的x向量块编号完全相同的各矩阵行, 组成各个small_block;
S4、取block做Spmv时的性能评价函数,在依赖的x向量块的个数不超过 阈值的前提下,合并部分small_block形成big_block;
S5、跟据big_block信息,包含稀疏矩阵A中的多行,以及在进行稀疏矩阵 向量乘计算时需求的x向量块信息,建立稀疏矩阵A',按照big_block数组顺序 将A中的行映射到A'中,按照big_block数组顺序,将A中的行写入到A'中;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡江南计算技术研究所,未经无锡江南计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910919675.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种卡片渲染方法及电子设备
 - 下一篇:一种火龙果园的水肥管理方法
 





