[发明专利]一种基于分布式内存的并行数字地形分析优化方法有效
申请号: | 201510036719.5 | 申请日: | 2015-01-23 |
公开(公告)号: | CN104598600B | 公开(公告)日: | 2017-10-10 |
发明(设计)人: | 窦万峰;李岩 | 申请(专利权)人: | 南京师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F15/16 |
代理公司: | 南京知识律师事务所32207 | 代理人: | 李媛媛 |
地址: | 210046 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于数字地形分析和并行计算的交叉技术领域,涉及一种基于分布式内存的并行数字地形分析优化方法。包括面向并行数字地形分析的数据分发粒度和结果融合粒度的模型及其计算方法;基于分布式内存的数据顺序分发和调度策略;考虑计算节点启动与关闭开销的数据拆分块数目的最优化方法;基于最优的数据块数目的集群节点配置参数选择方法。本发明完全可应用于大规模海量数据的并行数字地形分析的高性能计算的数据拆分和集群参数选择场合,例如,规则格网并行插值、坡度坡向并行计算、洼地填平并行计算等地形因子提取;可以应用于地理信息处理的高性能计算;也可以应用于基于地理信息的空间决策分析和数据挖掘等应用场合,提高处理效率。 | ||
搜索关键词: | 一种 基于 分布式 内存 并行 数字 地形 分析 优化 方法 | ||
【主权项】:
一种基于分布式内存的并行数字地形分析优化方法,其特征在于,所述方法包括:(一)确定面向并行数字地形分析的数据分发粒度和结果融合粒度的大小,其中,数据分发粒度DDG是指任务的计算时间与该任务需要的数据分发时间的比值,可以表示为:DDG=TcTd---(1)]]>Tc为任务的计算时间,Td为数据的分发时间,包括数据从外部存储器读取的I/O时间;结果融合粒度RFG是指计算结果的回收与融合时间与数据的分发时间的比值,可以表示为:RFG=TrTd---(2)]]>Tr为计算结果的回收与融合时间,也包括数据写入外部存储器的I/O时间;数据分发粒度DDG和结果融合粒度RFG的具体计算过程如下:步骤11,选取一个大小为Q的基本数据块,然后根据算法设计程序,并运行,分别测得Qh=h*Q的数据分发时间,h为整数且h=1,2,…10,计算时间和结果回收时间;步骤12,根据公式(1)和(2)的定义,分别计算得到DDGh和RFGh的值,然后分别计算数据分发粒度的平均值和结果融合粒度的平均值即,DDG‾=Σh=110DDGh10]]>RFG‾=Σh=110RFGh10;]]>(二)分布式内存并行计算模式下,基于分布式内存的数据顺序分发和调度策略:数据分发和任务计算同时进行,考虑计算节点或进程启动与关闭开销,计算数据拆分的数据块最优数目和块大小;基于数据块最优数目,对集群节点配置参数进行优化选择;具体过程包括:步骤21,确定最优的数据块数目和大小:已知待计算的数据大小W,数据分发速度V,进程启动延迟开销δ,以及由上一步得到的数据分发粒度的平均值和结果融合粒度的平均值根据下面公式计算得到最优的数据块数目K:K=W(DDG‾+RFG‾)Vδ]]>步骤22,根据数据大小W和拆分的数据块数目K得到单个数据块的大小P:P=WK]]>步骤23,由下式得到总的计算时间为:T=2W(DDG‾+RFG‾)δV+WV]]>步骤24,确定并行计算集群的参数,即节点数目或核总数N,最佳的并行计算集群的节点数目或核总数应为最优的数据块数目K,即一个轮次全部计算完毕。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京师范大学,未经南京师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510036719.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种支持数据持久化的内存存取方法和装置
- 下一篇:命名排歧方法及系统