[发明专利]确定权威网站的方法及装置有效

专利信息
申请号: 200810225178.0 申请日: 2008-10-30
公开(公告)号: CN101383730A 公开(公告)日: 2009-03-11
发明(设计)人: 佟子健 申请(专利权)人: 北京搜狗科技发展有限公司
主分类号: H04L12/24 分类号: H04L12/24;H04L12/26
代理公司: 北京集佳知识产权代理有限公司 代理人: 逯长明
地址: 100084北京市海淀区中关*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 确定 权威 网站 方法 装置
【说明书】:

技术领域

发明涉及网络技术,具体涉及一种确定权威网站的方法及装置。 

背景技术

目前,随着网络技术的发展,互联网作为一个庞大的信息资源,成为了人们获取信息的最方便、快捷的途径,也是最主要途径之一。 

通常,通过互联网获取信息的最常用手段是利用搜索引擎进行搜索,然后从搜索结果中找寻所需的信息。由于互联网中存在的各种信息的质量参差不齐,低质量的信息很可能会误导用户,甚至给用户带来不必要的物质和精神损失。 

为了便于用户能够获得高质量的信息,产生了一些提供导航目录类的网站,这些网站对互联网信息做了全面、多层次的分类,列出了各个不同领域及其子领域内的权威网站。所谓权威网站是指该网站提供的信息在真实性、权威性、及时性和全面性等方面都优于本领域内的其它网站。 

但这些权威网站的生成需要通过人工编辑的方式来选择,手工挑选每一个领域内的权威网站,人工成本高、周期长,而且需要相关人员全面了解各个领域内的相关知识。 

发明内容

本发明提供一种确定权威网站的方法及装置,能够自动得到各领域内稳定有效的权威网站。 

为此,本发明提供如下技术方案: 

一种确定权威网站的方法,包括: 

搜索引擎获取同一领域内的多个关键词; 

获取所述多个关键词分别对应的被点击网页; 

分别统计各网站内的所述被点击网页的局部信息,所述被点击网页的局部信息具体:是网页被点击的次数和点击的用户数,或者是被点击的网页数和点击的用户数,或者是网页被点击的次数、被点击的网页数、以及点击的用户数 这三者; 

信息包括:查询词、查询时间、查询用户、被点击网页; 

根据所述查询信息统计全局信息,所述全局信息包括:每个网站内被点击网页的数量、网站内被点击网页对应的所有查询词的数量、网站内被点击网页对应的所有查询词的查询量; 

所述获取所述领域内的关键词对应的被点击网页包括: 

根据所述用户的查询信息及所述全局信息获取所述关键词对应的被点击网页。 

优选地,所述根据所述局部信息确定对应所述领域的权威网站包括: 

根据所述局部信息计算对应各网站的判决参数; 

如果所述判决参数超过设定的阈值,则将对应该判决参数的网站设定为权威网站。 

所述判决参数包括: 

所述领域内某网站中网页被点击数与所述领域内所有网站中网页被点击数的比值;和/或 

所述领域内某网站中被点击网页数与所述领域内所有网站被点击的网页数的比值。 

优选地,当所述判决参数有多个时,对应每个判决参数都设置有一个阈值。 

优选地,所述方法还包括: 

在统计各网站内的所述被点击网页的局部信息之前,对所述网页进行过滤;所述对网页进行过滤包括: 

过滤掉同一个用户多次查询相同查询词点击的多个网页;和/或 

过滤掉对应所述查询词在短期内爆发式查询点击的多个网页。 

可选地,所述获取同一领域内的多个关键词包括: 

为所述领域选取一个权威网站; 

获取点击所述权威网站下网页的查询词集合; 

通过过滤所述查询词集合,确定所述领域内的关键词。 

优选地,所述通过过滤所述查询词集合,确定所述领域内的关键词包括: 

如果查询词对应的被点击网站中所述领域权威网站的数量与该领域已知权威网站的数量的比值大于设定的第一阈值,则确定所述查询词为所述领域内的关键词;和/或 

如果查询词对应的被点击网站中所述领域权威网站的数量与所述查询词对应的被点击网站数量的比值大于设定的第一阈值,则确定所述查询词为所述领域内的关键词;和/或 

如果查询词对应的被点击网站中属于所述领域权威网站的数量与查询词对应的被点击网页数量的比值大于设定的第一阈值,则确定所述查询词为所述领域内的关键词。 

优选地,所述方法还包括: 

对确定的对应所述领域的权威网站下网页的查询词集合进行过滤,重新确定所述领域内的关键词; 

根据重新确定的所述领域内的关键词进行迭代处理,重新确定对应所述领域的权威网站; 

当迭代处理满足设定的终止条件后,根据迭代结果确定对应所述领域的权威网站。 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810225178.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top