[发明专利]搜索系统及搜索方法无效
申请号: | 200710181521.1 | 申请日: | 2007-10-18 |
公开(公告)号: | CN101149758A | 公开(公告)日: | 2008-03-26 |
发明(设计)人: | 刘丽丽;李军 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京康信知识产权代理有限责任公司 | 代理人: | 尚志峰;吴孟秋 |
地址: | 518057广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 系统 方法 | ||
技术领域
本发明涉及搜索引擎领域,尤其涉及一种在搜索引擎系统中实现关联搜索的系统及方法。
背景技术
搜索引擎系统是对不同格式、不同载体、不同来源的信息进行整合,将这些信息索引存储,并通过接收用户的查询指令向用户提供符合其查询要求的信息资源的系统。
搜索引擎系统需要为用户提供一个信息查询界面。现有的搜索引擎系统主要包括分类目录及关键词两种信息查询途径。分类目录查询是以资源结构为线索,将信息资源按照内容进行层次分类,使用户能依现行结构逐层逐类检索信息。并且,关键词查询是利用建立的索引库来向用户提供查询服务的。用户只要把想要查找的关键词或者短语输入查询词中,搜索引擎就会根据用户输入在索引库中查找相应的词语,并进行必要的逻辑运算,最后给出查询的命中结果。
但是,在上述几种方式都存在一些缺陷:
(1)利用信息资源进行层次分类的方式,如果分类较少,用户无法准确获取所需要的信息。如果分类较多,用户选择需要的分类信息要花费较多的时间。
(2)采取层次分类的方式,还对信息的整合要求较高。搜索引擎系统必须在进行信息收集、整合的时候提取信息的分类信息,这需要采取人工干预的方式,或者仅整合可靠信息来源的信息的方式来保障分类信息的准确度。
(3)采用用户输入关键字进行查询,搜索结果的质量同用户描述关系很大。如果用户输入越简洁、准确,那么得到的搜索结果的准确度越高。若用户输入不准确,则用户可能无法得到真正需要的信息,而且垃圾信息众多。
(4)用户有可能不确定自己到底想搜索的内容是什么,只有一个大致方向,这时不容易得到理想的搜索结果。
(5)用户若使用的查询词不妥当,容易造成垃圾结果众多。或者是使用的查询词较生僻,不能搜索到所需要的结果。
发明内容
鉴于上述问题,本发明目的在于提供一种根据用户的输入内容提取用户搜索关键词,根据该关键词进行扩展并进行相关搜索以达到最大限度的利用用户关键词得到用户所需要信息的搜索系统及搜索方法。
根据本发明的一个方面,提供了一种搜索系统,其包括:输入输出模块,连接到分词模块和查询模块,用于接收来自外部网络的用户的查询内容,以及将最终的查询结果返回给用户;分词模块,连接到输入输出模块,用于接收来自输入输出模块的用户的查询内容,并在对其进行分词、搜索、整合后,将关键词信息发送给输入输出模块;以及查询模块,连接到输入输出模块,用于将通过输入输出模块接收到的、来自分词模块的关键词信息在索引库中进行索引,然后将查询结果发送给输入输出模块。
此外,本发明的搜索系统还包括:关联索引维护模块,用于维护所述关联词信息搜索时所需的关联词索引库。
其中,在上述分词模块中包括:中文分词模块,用于根据不同的分词方法对用户的查询内容进行分词,并输出分词信息给整合模块;关联搜索处理模块,用于接收分词模块的分词信息,利用分词信息在关联词索引库中进行搜索,并输出关联词信息给整合模块;以及整合模块,用于将作为分词结果的分词信息、和作为搜索结果的关联词信息整合为关键词信息。
并且,在查询模块中包括:索引模块,用于对需要搜索的内容建立索引库,对索引进行维护,并当源信息更新时,同步更新索引库的信息。
其中,上述分词方法包括机械分词法中的最大左匹配法。
根据本发明的另一方面,提供了一种搜索方法,其包括:步骤一,用户通过外部网络与输入输出模块交互,向输入输出模块提交查询内容;步骤二,输入输出模块接收查询内容,并发送给分词模块,分词模块对查询内容进行分词、搜索、整合后发送关键词信息给输入输出模块;步骤三,输入输出模块将关键词信息发送给查询模块,查询模块在索引库中对关键词信息进行索引,并将查询结果发送给输入输出模块;步骤四,输入输出模块将查询结果进行调整后返回给用户。
在上述的搜索方法中,还包括:由关联索引维护模块维护所述关联词信息搜索时所需的关联词索引库。
并且,在步骤二中还包括以下步骤:根据不同的分词方法由中文分词模块对用户的查询内容进行分词,并输出分词信息给分词模块;由关联搜索处理模块接收分词模块的分词信息,利用分词信息在关联词索引库中进行搜索,并输出关联词信息给分词模块;以及通过整合模块将作为分词结果的分词信息、和作为搜索结果的关联词信息整合为关键词信息。
此外,在上述步骤三中还包括:由索引模块对需要搜索的内容建立所述索引库,对索引进行维护,并当源信息更新时,同步更新所述索引库的信息。
其中,上述分词方法包括机械分词法中的最大左匹配法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710181521.1/2.html,转载请声明来源钻瓜专利网。