[发明专利]适合分布式并行计算的PBiCOR方法在审
申请号: | 201510411590.1 | 申请日: | 2015-07-14 |
公开(公告)号: | CN105045565A | 公开(公告)日: | 2015-11-11 |
发明(设计)人: | 张理涛;张国辉;周永卫;武大勇;刘敬怀;张炎 | 申请(专利权)人: | 郑州航空工业管理学院 |
主分类号: | G06F9/38 | 分类号: | G06F9/38;G06F9/54 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 李阳 |
地址: | 450015 河*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 适合 分布式 并行 计算 pbicor 方法 | ||
1.适合分布式并行计算的PBiCOR方法,其特征在于,假设并行机具有P台处理机,每台处理机分别具有局部存储模块和相应的处理单元,处理单元之间通过互联网相连;
假定采用SPMD模型,即所有的处理单元执行相同的程序,且一个处理单元需要远程处理单元的数据时,必须通过消息传递完成;
P为处理器台数,N为稀疏矩阵A的维数,nz为矩阵A每行(列)非零元素的平均个数,tfl为一个浮点操作的时间,ts为一个消息启动时间,tw为一个字在两台处理器间传递所需的时间,一个内积或一个向量校正的计算时间为2tflN/P,其中N/P为分配给每个处理器的未知量个数,(2nz-1)tflN/P为稀疏矩阵向量乘积的计算时间;
具有P台处理器的矩阵(或网状)分布式并行式,并假设通讯是二叉树方式进行的,则一个内积的整体聚集和广播的时间为2logP(ts+tw),而同时聚集和广播K个内积的时间为2logP(ts+ktw),稀疏矩阵已被映射到各处理器,使得矩阵向量乘积只需相邻处理器间的局部通讯,矩阵向量乘积所需的通讯是交换边界数据,即从其他处理器接收边界数据和向其他处理器发送边界数据,假设每个处理器必须接收和发送nm个信息,每个处理器上有nb边界数据单元个数,因此,每个处理器必须进行通讯的总字长为2(2nb+nm);
由于不需通讯,一个向量校正的时间为:
tvec_upd=2tflN/P(2)
只需一次全局通讯的K个内积的时间为:
tinn_prod(k)=2ktflN/P+2logP(ts+ktw)(3)
只需局部通讯的一个矩阵向量乘积的时间为:
tmat_vec=(2nz-1)tflN/P+2nmts+2(2nb+nm)tw(4)
一个矩阵向量乘积的通讯时间为2nmts+2(2nb+nm)tw。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州航空工业管理学院,未经郑州航空工业管理学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510411590.1/1.html,转载请声明来源钻瓜专利网。