[发明专利]基于剪枝的图漫游并行计算方法和应用有效
申请号: | 201610192758.9 | 申请日: | 2016-03-30 |
公开(公告)号: | CN105808779B | 公开(公告)日: | 2019-06-07 |
发明(设计)人: | 余华山;王娜;孟佳 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F16/958 | 分类号: | G06F16/958 |
代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 苏爱华 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公布了一种基于剪枝的图漫游并行计算方法和应用,涉及大规模数据并行计算和处理技术领域,该方法在共享内存系统上实现的基于剪枝的高效图漫游,在计算之前的预处理阶段,根据拓扑特征识别出图中的边界点,在此基础上计算过程中进行相应的剪枝计算操作。本发明通过剪去边界点,使得顶点的更新速度能够更快扩散,算法的收敛速度加快,从而减少迭代轮数;在并行计算中对任务进行划分时,剪去边界点使得任务划分更加均衡,以达到降低计算开销、提升计算性能的目的。 | ||
搜索关键词: | 基于 剪枝 漫游 并行 计算方法 应用 | ||
【主权项】:
1.一种基于剪枝的图漫游并行计算的网页重要性排序方法,将网页和网页之间的链接关系表示为图G,用图中顶点vi分别代表不同页面,用顶点vi指向vj的箭头表示页面i中有指向页面j的超链接;对图中顶点进行分类,针对图中的边界点进行剪枝操作,通过剪除边界点来优化计算过程,包括预处理阶段、剪枝计算阶段、收尾补充计算阶段;具体包括如下步骤:1)在预处理阶段,识别图的拓扑特征,对图进行预处理操作;具体步骤如下:11)读入图数据,根据图中顶点的拓扑特征进行搜索,得到边界点和非边界点;边界点分为a类、b类、c类和d类;具体为:a类:入边数量为0的顶点;b类:入边、出边数量均为1的顶点,且该顶点的父节点u1符合条件b1或b2:b1:u1的入边数量为0,出边数量为1;b2:u1为b类顶点;c类:出边数量为0的顶点;d类:入边、出边数量均为1的顶点,且该顶点的子节点u2符合条件d1或d2:d1:u2的出边数量为0,入边数量为1;d2:u2为d类顶点;12)对a类和b类边界点进行初始化,即根据选用的计算方法进行计算,得到相应边界点的计算结果;13)对于a类和b类边界点,当它们的子节点为非边界点时,将步骤12)的计算结果传递给它们的子节点;14)将a类和b类边界点与它们的子节点之间的边从图结构中删去;2)在计算阶段,对预处理后的图进行剪枝迭代计算;21)依次访问图中的顶点,如果该顶点为 边界点,则跳过该顶点;否则对该顶点利用步骤12)所述计算方法重新进行计算,得到新的计算结果,作为该顶点的计算结果;22)顶点全部访问结束后,根据步骤12)所述计算方法所设定的收敛条件,当当前图中所有顶点达到收敛条件时,结束剪枝计算;否则,重复21~22进行剪枝迭代计算;3)在收尾阶段,进行补充计算;对c类和d类边界点,根据步骤12)所述计算方法进行计算,得到计算结果,作为相应边界点的结果;4)根据所有顶点的计算结果进行排序,得到网页的重要性排序结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610192758.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种贮箱晃动质量的数值计算方法
- 下一篇:一种触发式参数生效方法及装置