[发明专利]网络中节点重要性的排序方法无效
| 申请号: | 201010501123.5 | 申请日: | 2010-10-09 |
| 公开(公告)号: | CN101976245A | 公开(公告)日: | 2011-02-16 |
| 发明(设计)人: | 吕琳媛;周涛;张翼成 | 申请(专利权)人: | 吕琳媛;周涛 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 温利平 |
| 地址: | 100041 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 网络 节点 重要性 排序 方法 | ||
技术领域
本发明属于网络中节点分析技术领域,更为具体地讲,涉及网络中节点,如网页重要性的排序方法。
背景技术
网络中节点重要性的排序是一个非常重要的问题,例如对网页的排序是搜索算法的核心。
现有技术中最著名的节点重要性排序方法是2001年9月4日公布的、Lawrence Page发明的美国US 6285999B1号专利,即“链接数据库中节点排序方法”(METHOD FOR NODE RANKING IN A LINKED DATABASE),简称PageRank算法。它是Google搜索引擎排名运算法则的一部分,用来标识网页的等级/重要性。Google搜索引擎通过PageRank算法来调整结果,使那些更具“等级/重要性”的网页在搜索结果中网站排名获得提升,从而提高搜索结果的相关性和质量。
PageRank算法存在的主要数学缺陷是无法处理悬摆链,也就是指出度为零的网页(没有链出边的网页)。目前有两种方法:
1、将这些出度为零的网页剔除掉,先计算剩下网页的排序分,然后再计算剔除网页的分数。
2、引入一个随机跳转概率,即走到悬摆链的时候会以一定概率随机选择网页链入,这样会使得网页排序结果严重依赖随机跳转概率参数的选择,也就是说不同的随机跳转概率参数会得到不同的排序结果。目前经验的随机跳转概率是0.15,但是没有理论能够证明为什么选择这个值,同时随着系统的演化发展,最优取值很可能发生变化。
另一个著名的节点重要性排序方法是HITS算法。该算法同时考虑了节点权威性(authority)和中枢性(hub)。一个节点的权威值等于链入它的节点的hub值的和,一个节点的hub值等于它指向的节点的权威值之和。由此可见HITS的权威值和中枢值的计算都是依赖于节点相互关系的。因此HITS算法也有一个问题就是很难处理包含多个集团的网络。因为各个集团之间没有链接,很难说明集团A比集团B更重要,因此也就不能确定集团A中的节点比集团B中的节点更加权威或者中枢性更强。
发明内容
本发明的目的在于克服现有技术的不足和局限性,提出一种网络中节点重要性的排序方法,以解决无法处理悬摆链和包含多个集团的网络的技术问题。
为实现上述发明目的,本发明网络中节点重要性的排序方法,其特征在于,包括以下步骤:
(1)、将需要排序的具有链接关系的文件转换成有向网络,其中有向网络中的节点为需要排序的具有链接关系的文件,边为节点间的链接关系;
(2)、加入背景节点,并且背景节点与有向网络中的每个节点都建立双向的链接;
(3)、初始时刻给每个节点一单位的资源,然后在这个含有背景节点的有向网络中随机游走,进行资源分配,直到达到稳态;
(4)、将稳态时背景节点的资源分配到其他节点中,稳态时,每个节点上的资源数加上从背景节点获得的资源数之和为该节点重要性分数;
(5)、按照重要性分数从高到低的顺序将节点排序,排在越前面的表示该节点越重要,或者说他的影响力越大。
本发明的目的是这样实现的:
加入一个背景节点,并且背景节点与有向网络中的每个节点都建立双向的链接;初始时刻给每个节点一单位的资源,然后在这个含有背景节点的有向网络中随机游走,进行资源分配,直到达到稳态;将稳态时背景节点的资源分配到其他节点中;稳态时,每个节点上的资源数加上从背景节点获得的资源数之和为该节点重要性的分数;按照重要性分数从高到低的顺序将节点排序,排在最前面的表示该节点越重要,或者说他的影响力越大。本发明在PageRank的基础上引入背景节点,原来出度为0的节点就有了出度,使得原来依赖于参数的排序方法变成了不依赖参数的方法,从而解决了节点排序中悬摆链的问题;同时,加入背景节点后,原来不连通的两个集团就可以通过背景节点连接起来,使得本发明的排序方法可以处理含有多个独立集团的网络排序问题。
附图说明
图1是本发明网络中节点重要性的排序方法的一种具体实施方式流程图;
图2是本发明中背景节点与有向网络中每个节点都建立双向链接后的网络拓扑结构图;
图3是本发明一实例中有向网络的拓扑结构示意图;
图4是本发明一实例中加入背景节点的有向网络拓扑结构示意图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
实施例
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吕琳媛;周涛,未经吕琳媛;周涛许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010501123.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:焊接装置及焊接方法
- 下一篇:基于动态网页的可扩展的Word报告自动生成方法





