[发明专利]基于用户兴趣的个性化元搜索引擎及搜索结果处理方法无效
申请号: | 200910020951.4 | 申请日: | 2009-01-16 |
公开(公告)号: | CN101477554A | 公开(公告)日: | 2009-07-08 |
发明(设计)人: | 杜晨光;颜涛;邓双成;李晓辉 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 陕西电子工业专利中心 | 代理人: | 王品华;黎汉华 |
地址: | 71007*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 用户 兴趣 个性化 搜索引擎 搜索 结果 处理 方法 | ||
技术领域
本发明属于互联网信息处理技术领域,涉及搜索引擎、Web数据挖掘和知识发现技术,特别是涉及基于用户兴趣的个性化元搜索系统及方法,用于互联网的搜索引擎。
背景技术
搜索引擎的出现,大大提高了人们对互联网信息检索的能力和效率,已经成为互联网的基础应用之一。据中国互联网络信息中心在2008年中期的统计,中国网民搜索引擎的使用率为69.2%,并处在高速增长之中,而在互联网高度普及的美国,网民对搜索引擎的使用率已达91%。可见,上网用户对搜索引擎已经产生了强烈的依赖。
目前,搜索引擎领域主要有以下几种技术:
(1)传统搜索引擎:这种搜索引擎目前应用最广泛且用户数量最多,主要代表有谷歌(www.google.com)、百度(www.baidu.com)、雅虎(cn.yahoo.com)等。
这种搜索引擎虽然给人们带来了便利,但是它们却存在着本身无法克服的缺陷。根据专业评测,目前主流搜索引擎的网络资源覆盖面加在一起只占整个网络的约42%,返回的结果相关度不足45%,而且由于对网页的索引和排序机制互不相同,导致同样一个搜索请求在不同搜索引擎中的查询结果的重复率不足34%。因此,单个这样的搜索引擎是无法满足用户搜索需求的,要想获得一个比较全面、准确的搜索结果,用户就必须反复调用多个搜索引擎,这大大降低了用户的检索效率,提高了信息检索的难度。
(2)元搜索引擎(Meta-SearchEngine):元搜索引擎的出现,在一定程度上弥补了传统搜索引擎的不足,其主要代表有国外的MetaCrawler(www.metacrawler.com)、Dogpile(www.dogpile.com)和国内的比比猫(www.bbmao.com)等。元搜索是一种将用户检索请求同时发送给多个独立搜索引擎,并将它们的搜索结果汇集在一起返回给用户的搜索技术。它的优点是综合了多个独立搜索引擎的搜索结果,从而提高了搜索结果在整个网络资源上的覆盖率,省去了用户自己逐个调用不同搜索引擎进行查询的麻烦。
但是,目前已投入实用的元搜索引擎的搜索结果排序方式仅仅是以各独立搜索引擎返回结果的排序或某种统一的排序原则为依据的,所以对与不同用户的搜索请求不能做到根据用户的兴趣喜好和搜索意图返回与之相适应的排序结果,即搜索的准确度并未得到有效提高。因此,在信息量巨大的互联网世界里用户想要找到自己需要的信息的难易程度并未得到有效改善。
(3)个性化搜索引擎(Personalized Search Engine):为了满足用户的个性化搜索需求,弥补传统搜索引擎和元搜索引擎的不足,给用户提供更为精准的搜索服务,人们提出了个性化搜索引擎的思想,这种搜索引擎目前还处于技术研究和初步应用阶段。在这方面的研究中,具有代表性的方法一个是通过用户对搜索结果进行打分来调节搜索结果的排列次序,一个是将用户的搜索历史存放在用户计算机的cookie文件中,作为以后用户进行搜索的参考来影响搜索结果的次序。
但是这些方法仍存在缺陷。对于依靠用户打分来说,大量用户对搜索结果的评价并不能准确刻划某个特定用户的兴趣喜好,无法实现针对每个用户的个性化服务;对于在用户计算机上记录用户搜索历史来说,这种方法实际上只是记录了这台计算机上进行过的搜索历史,如果使用该计算机的用户更换或者用户在别的计算机上进行搜索,则这种个性化搜索的作用就失效了。
从上面介绍的目前存在的三种搜索引擎技术来看,个性化搜索技术无疑是搜索引擎进一步发展的方向,但这个领域的技术研究还远未达到成熟阶段,需要有更加有效和实用的个性化搜索技术来改善用户的搜索体验。
发明内容
本发明的目的在于避免上述已有搜索引擎的缺陷,提供一种基于用户兴趣的个性化元搜索引擎及其搜索结果处理方法,以准确确定用户兴趣和搜索意图,在服务器上长期保存和及时更新用户兴趣,并利用用户兴趣和搜索意图对元搜索的搜索结果进行个性化排序,提高搜索结果的覆盖度和搜索的准确度。
本发明的目的是这样实现的:
本发明的搜索系统主要由用户注册/登录单元、元搜索结果收集单元和个性化处理单元组成,其中个性化处理单元,包括:
搜索结果预处理模块,用于接收元搜索结果收集单元送入的搜索结果原始数据,进行基于网址和基于摘要内容的去除重复处理,并将处理后的搜索结果送入个性化排序处理模块;
个性化排序处理模块,用于接收搜索结果预处理模块送入的搜索结果数据,并进行基于用户兴趣和搜索意图的个性化排序处理,将排序后的搜索结果提交给用户;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910020951.4/2.html,转载请声明来源钻瓜专利网。