[发明专利]一种网页中确定链接文字权重的方法和设备无效
申请号: | 201010180876.0 | 申请日: | 2010-05-24 |
公开(公告)号: | CN102262629A | 公开(公告)日: | 2011-11-30 |
发明(设计)人: | 王顼 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鑫媛睿博知识产权代理有限公司 11297 | 代理人: | 龚家骅 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网页 确定 链接 文字 权重 方法 设备 | ||
技术领域
本发明涉及互联网领域,特别是涉及一种网页中确定链接文字权重的方法和设备。
背景技术
随着Internet的迅速发展,网络作为一种广义的、宽泛的、公开的、对大多数人有效的传媒,互联网通过大量的,每天至少有几千人乃至几十万人访问的网站,实现了真正的大众传媒的作用。互联网可以比任何一种方式都更快、更经济、更直观、更有效地把一个思想或信息传播开来。
根据权威机构的统计,50%的用户阅读在线的杂志,48%的用户阅读在线报纸。印刷出版物书籍,即使是报纸,从编辑、排版、印刷到发行都需要时间,而网页则非常简单,只要放在网上就可以了。印刷出版物是要送到读者手里的,而网页则由读者自己来取,读者可以常看常新,随时追踪事件的发展。并且,由于网页使用的链接文字可以通过链接的方式指向互联网上所有与该网页相关的内容,不管是进行理论研究,还是读新闻,都可以很方便地找到相关的资料。
所谓链接文字是对目标页面的一种有效表述,是一个网页用来指明链向其他网页的文字,通过点击这段文字,可以访问到这段文字后的目标网页(指向网页),在搜索引擎中具有重要的作用,同时,为了表明这个链接文字的重要程度,会对该链接文字给与一个权重值,用于表明其重要程度。
通过记录用户在网页上的点击行为并结合已有的网页链接文字信息,获取到用户的点击行为和有效链接文字。
为方便描述,如图1所示,网页A中的三个连接文字AB,AC,AD,链接文字AB是从网页A指向网页B,链接文字AC是从网页A指向网页C,链接文字AD是从网页A指向网页D,链接文字AB,AC,AD都是从网页A中指向其他页面的,现有的链接文字权重的计算方法,通过网页A的链接文字权重RA/M(RA表示网页A的权重,M为网页A的出链个数)得到链接文字的权重,所以三者的权重是一样的。
但在实际的使用中,链接文字AB,AC,AD对于用户来说,有效程度是不一样的,例如:对于网页A有N(N为网页A总用户点击数)个点击链接文字的行为,其中有NB个点击链接文字AB,NC个点击链接文字AC,ND个点击AD(N=NB+NC+ND)。因此,对于网页A出链的三个链接文字而言,由于点击次数的不同,其权重也应该是不相同的。由于链接文字的权重对于搜索引擎是很重要的计算因子,因此,权重是否准确直接决定了搜索引擎的效果。
而基于上述情况,上述现有技术中提供的链接文字权重的获取方法无法准确得到链接文字的权重。
发明内容
本发明提供了一种网页中确定链接文字权重的方法和设备,以解决链接文字与实际情况不符的问题,实现有效地获取网页中重要的连接文字,该方法包括:
获取一个网页的数据信息和所述网页的访问信息;
根据所述网页的数据信息和所述网页的访问信息结合预设策略确定在所述网页中的各个链接文字的权重。
其中,所述网页的数据信息,包括:
所述网页的权重和网页中的各个链接文字,以及所述网页的指向网页。
其中,所述获取网页的访问信息,包括:
通过用户监控系统获取所述网页的总访问量和所述网页中各个链接文字的点击次数。
其中,所述预设策略,具体包括:
当所述网页访问信息是用户监控系统监控到的访问和点击情况时,根据所述网页中不同链接文字点击数的不同确定所述网页中不同的链接文字的权重。
其中,所述根据所述网页中不同链接文字点击数的不同确定所述网页中不同的链接文字的权重,具体包括:
所述网页的权重乘以所述网页中链接文字的点击次数与所述网页总访问量的比值。
一种网页中确定链接文字权重的设备,所述设备包括:
获取单元,获取一个网页的数据信息和所述网页的访问信息;
数据确定单元,与所述获取单元连接,根据所述网页的数据信息和所述网页的访问信息结合预设策略确定在所述网页中的各个链接文字的权重。
其中,所述获取单元用于,获取所述网页的权重和网页中的链接文字,以及所述网页的指向网页。
其中,所述获取单元还用于,通过用户监控系统获取所述网页的总访问量和所述网页中各个链接文字的点击次数。
其中,所述数据确定单元包括:
判断子单元,用于判断网页访问信息是否为用户监控系统监控到的访问和点击情况;
确定子单元,与所述判断子单元相连,用于当所述网页访问信息是用户监控系统监控到的访问和点击情况时,根据所述网页中不同链接文字点击数的不同确定所述网页中不同的链接文字的权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010180876.0/2.html,转载请声明来源钻瓜专利网。