[发明专利]一种检索的方法和系统有效
| 申请号: | 201080071023.1 | 申请日: | 2010-12-31 |
| 公开(公告)号: | CN103314371B | 公开(公告)日: | 2017-12-15 |
| 发明(设计)人: | 肖岩 | 申请(专利权)人: | 肖岩 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京汇泽知识产权代理有限公司11228 | 代理人: | 刘淑敏 |
| 地址: | 130012 *** | 国省代码: | 吉林;22 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 检索 方法 系统 | ||
技术领域
本发明涉及计算机信息处理领域,特别是一种检索的方法和系统。
背景技术
现有信息检索技术中,处理检索字符串的方法有很多,最常见的是基于统计方法提出的技术方案,也有专门根据特定语义规则构造专用信息检索方法。在不处理语义即不针对语义处理的一般信息检索与完全特定定义的语义规则的特定语义规则检索之间,成熟方案目前只有用前述的统计方法去归纳、猜测语义。此外,现在知道的就只有利用互联网络海量信息链接特性、基于引用(链接指向)的google page rank(Google网页级别)方法。
综上可知,现有信息检索处理技术在实际使用上,显然存在不便与缺陷,所以有必要加以改进。
同时关于检索提示。搜索引擎的用途是提供用户所关心的信息的引导,用户利用搜索引擎,根据其已知信息来获得所关心的、未知的信息。但用户对未知信息未必能够找到恰当和准确的文字描述,另外即使用户知道主要的关键字,也希望与此关键词有关的信息都有良好、充分的提示。现有技术包括:1、中国专利申请号为200610112822.4,名称为"基于倒排表进行检索提示的方法"。2、百度相关搜索和google的关键字工具、等。这些技术都是基于对用户输入的查询词统计而生成检索提示的。其缺点在于:首先,这些提示的内容都是经过筛选后的排名靠前的数据。这些数据仅仅是一个列表,在内容上是不完备的。其次,这些以列表的形式展现给用户的数据,由于相互之间互相独立,各条信息都独立存在,而且包含了与检索词有关的提示信息,这就造成其数据量常常会非常大,用户从中查找有用信息的工作量会显著加大。再次,这些信息之间没有逻辑结构与语义特征,给出的检索提示让用户无所适从。百度相关搜索只给出了10个相关检索提示。Google关键字工具虽然可以给你最多150条的相关检索提示,但这些提示是无组织的,没有逻辑相关性。另如,这些检索提示多基于对海量用户的行为进行建模,认为多数人的行为就是检索用户所需要的。比如在2008年,北京与奥运之间,经过统计海量用户,证明两者之间具备关联性;而在2009年春天的北京与甲流,2010年元旦的北京与暴雪之间,都具有关联性。一旦海量用户的搜索点击具有突然性、预设性,那么检索提示就会受到这种海量搜索点击的直接影响。有鉴于此,也需要找到更好的检索提示和展示检索信息的方法。
发明内容
有鉴于此,本发明的主要目的在于提供一种信息检索的处理方法及其系统,本发明由检索字符串的形式化过程去提炼语义、引导和返回检索信息。附加地使得检索提示更加简洁清晰、逻辑完备。
为实现本发明目的而提供的一种检索的方法,包括步骤:
A.根据用户在终端上所输入检索词查询检索词目录表,获取包含所述输入检索词的第一数据项集合;其中,所述第一数据项集合的各个数据项之间存在亲属关系;
B.根据与所述输入检索词相关联的第一数据项集合的各个数据项,查询信息索引数据表,获取第二数据项集合;
C.组合并发送所述第一数据项集合给所述终端;其中,所述第一数据项集合以递归方式组合;以及
向所述终端发送所述第二数据项集合。
较优地,所述步骤A中,还包括下列步骤:
A1.生成所述检索词目录表。
较优地,所述步骤B中,所述获取第二数据项集合,包括下列步骤:
由第一数据项集合的各个数据项,查询信息索引表,进行简单匹配获取第二数据项集合;或
由第一数据项集合的各个数据项,查询信息索引表,进行递归组合匹配获取第二数据项集合。
较优地,所述步骤A1中,生成检索词目录表,包括如下步骤:
Al1.将原始检索词数据表中的各个原始字符串两两互相匹配,确定相互之间的包含关系;
A12.根据所述包含关系,确定所述两两互相匹配的所述原始字符串之间的父子关系;
A13.根据所述两两互相匹配的具有父子关系的所述原始字符串,分别生成数据项集合
Dl、D2……Dn,其中,n大于等于1;所述数据项集合Dl、D2……Dn组成检索词目录表;其中,所述数据项集合Dn的各个数据项的所述原始字符串之间具有亲属关系。
较优地,所述包含关系包括:
左包含、右包含、居中包含或不包含。
较优地,所述步骤A12包括下列步骤:
如果所述至少两个原始字符串之间构成左包含或右包含关系,则将所述两个原始字符串设置为父子关系,所述被包含的原始字符串为父;及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于肖岩,未经肖岩许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080071023.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于手势的会话处理方法、装置
- 下一篇:具有除草活性的取代吡啶





