[发明专利]一种基于转移概率的网页排序方法及系统有效

专利信息
申请号: 201711259227.8 申请日: 2017-12-04
公开(公告)号: CN107943994B 公开(公告)日: 2018-08-21
发明(设计)人: 韦鹏程;石熙;黄思行;段昂 申请(专利权)人: 重庆第二师范学院
主分类号: G06F17/30 分类号: G06F17/30;G06K9/62
代理公司: 北京格允知识产权代理有限公司 11609 代理人: 周娇娇;谭辉
地址: 400065 重*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 转移 概率 网页 排序 方法 系统
【说明书】:

发明涉及一种基于转移概率的网页排序方法及系统,其中方法包括以下步骤:PR值计算步骤、根据改进的转移概率表达式计算马尔科夫链平稳分布时网页的PR值;其中改进的转移概率表达式中引入与当前网页的入链数量相关的值作为渗透比进行计算;网页排序步骤、根据网页的PR值的高低对网页进行排序。本发明对于网页链接PR值的平均分配问题进行了优化,不仅考虑了超链接的数量,也考虑了超链接的质量,本发明通过实验展示了优化算法的确提升了PR结果分布的准确性,在一定程度上提升了用户体验,同时对排序的管理也更加公平。

技术领域

本发明涉及信息技术领域,尤其涉及一种基于转移概率的网页排序方法及系统。

背景技术

信息技术的快速发展是二十一世纪所取得的重要成就,当前正是网络发展的黄金时代。过去人们通过阅读书本或者口头上的对话来获得信息。这就导致了人们获得的信息不仅依赖于其拥有书本的数量,同时依赖于其在社会中的地位和能力。然而,这样的信息获取方式复杂难懂,不及时,同时还准确度低。与此同时,人们之间的交流方法非常单纯,期间花费很长时间。总之,在互联网技术发展之前,人们的信息生活被时间和空间所限制,导致了巨大的不便和资源的浪费。直到互联网的诞生,这种情况才有所改变。人们对互联网的巨大需求使得互联网在许多不同的领域取得成就,同时也提供了多种不同的互联网产品。去年,中国相关部门的统计数字显示中国拥有巨量的互联网人口,数字大约为6.88亿。在中国,互联网的广泛使用成为了一个普遍现象,普及率大约为50.3%。移动互联网的使用更加普遍,手机的用户达到了6.2亿人。国际网络出口带宽达到了5392116Mbps,网站数量相比2014年增加了26.3%,达到了423万。作为互联网的基础应用,搜索引擎的使用率相比2014年提高了80%。到目前为止,人们依赖于互联网。同时搜索工具的用户使用频率也保持了一个巨大的增长趋势。

随着互联网技术的急速发展以及互联网上承载信息的快速增加,互联网成为了人们获取信息的主要方式。人们渴望在资源迅速扩张的世界快速检索所需要的信息。这种需求迫使传统的搜索引擎按照更加智能,更加个性化的方向进行改造。这样一种能够感知用户希望,满足用户个性化需求的个性化搜索引擎成为了未来的发展趋势。

网页排序技术毋庸置疑地是提高网络服务质量的核心,它不仅是用户体验的核心指标,也是开发者应该考虑的主要指导方向。目前,网页价值排名算法主要分析两个方面,也就是整体网页的总体内容描述以及页面间的指向方式和页面间的相互关联。然而网页数量的巨大以及其目前增长的快速使得它难以计算。与此同时,后者的引入为研究人员提供了一个新的思路,引发了关于搜索算法讨论的又一个高峰。目前,主要存在着两种不同的方法来计算网页间关联的权重:一是Sergery和Lawrence在1998年提出的PageRank算法,另一个是J.Kleinberg在1998年提出的经典主题提取算法HITS。这两种算法都经过多种实验检验,还主要用于Google和IBM的项目。当然,也有一些研究人员在这些想法的基础上提出了类似的算法并且在本地排序上应用取得了不错的结果。

PageRank算法广泛用于衡量页面的价值。它通过网页间的链接结构给每个页面设定一个分数,并且通过分数进行排序。从数学上看来,它可以看作一个马尔可夫随机游走模型,通过后一个网页的链接信息计算出他们的转移概率,最后得到稳定分布的马尔可夫链作为网页排序的最终结果。PageRank算法是基于引用机制拓展至“投票”策略而成的一种方法,就是说当一个页面指向他自己时,可以说成是一个页面与他本身所关联。这就等同于这个页面投给了自己一票,从而有助于计算相应的PR值,因此最初的算法设定为如下形式:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆第二师范学院,未经重庆第二师范学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711259227.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top