[发明专利]一种智能检索方法及其系统有效
申请号: | 201210124028.7 | 申请日: | 2012-04-25 |
公开(公告)号: | CN103377226A | 公开(公告)日: | 2013-10-30 |
发明(设计)人: | 张斌 | 申请(专利权)人: | 中国移动通信集团公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鑫媛睿博知识产权代理有限公司 11297 | 代理人: | 龚家骅 |
地址: | 100032 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 检索 方法 及其 系统 | ||
技术领域
本发明涉及通信领域的信息检索技术,尤其涉及一种智能检索方法及其系统。
背景技术
信息检索是指是指从信息集合中找出用户所需要的有关信息的过程。传统的全文检索技术基于关键词匹配进行检索,往往存在查不全、查不准、检索质量不高的现象,特别是在网络信息时代,利用关键词匹配很难满足人们检索的要求。
目前常用的信息检索方法是基于关键词匹配,即,先为要检索的内容设置关键词,然后通过关键词匹配来衡量是否为检索目标,一般认为匹配的关键词越多则越相近。
传统的基于关键词匹配的检索方法对基于句子且文本内容较少(比如微博)的检索不是很有效,这是由于文本内容较少,与关键词匹配的几率较小,因此检索到用户所需要的信息的几率就小,存在检索结果不全面(即查不全)的问题。
发明内容
本发明实施例提供了一种智能检索方法及其系统,用以解决现有信息检索技术检索结果不全面的问题。
本发明实施例提供的智能检索方法,包括:接收信息检索请求,提取其中携带的关键词;将所述关键词作为原始关键词,对所述关键词进行扩展;根据设定的组合级数N,通过对所述原始关键词和扩展得到的关键词进行排列组合,得到包含一元词组到N元词组的关键词集合;其中,N≥2;根据一元词组到N元词组各自对应的权重值,分别确定各被检索文本与所述关键词集合的相似度;根据各被检索文本与所述关键词集合的相似度,得到作为检索结果的被检索文本并返回检索结果。
本发明实施例提供的智能检索系统,包括:接收单元,用于接收信息检索请求,并提取所述信息检索请求中携带的关键词;关键词扩展单元,用于将所述关键词作为原始关键词,对所述关键词进行扩展;词组划分单元,用于根据设定的组合级数N,通过对所述原始关键词和扩展得到的关键词进行排列组合,得到包含一元词组到N元词组的关键词集合;其中,N≥2;相似度确定单元,用于根据一元词组到N元词组各自对应的权重值,分别确定各被检索文本与所述关键词集合的相似度;检索结果确定单元,用于根据各被检索文本与所述关键词集合的相似度,得到作为检索结果的被检索文本;发送单元,用于返回检索结果。
本发明的上述实施例,考虑到二元词组表达的信息比一元词组准确,三元词组表达的信息比二元词组准确,以此类推,通过引入二元词组、三元词组以致多元词组,提高了检索结果的有效性和准确性。
附图说明
图1为本发明实施例提供的智能检索流程示意图;
图2为本发明实施例中最多扩展到三元词组时的智能检索流程示意图;
图3为本发明实施例提供的智能检索系统结构示意图。
具体实施方式
本发明实施例提供的智能检索方法在传统的基于关键词匹配的检索方法基础上,引入了关键词扩展,且将扩展得到的关键词组成关键词集合,其中按照一元词组以及多元词组(包括二元词组,三元词组......N元词组,N≥1)进行区分,并赋予不同的权重,然后通过语义计算得到被检测文本与关键词集合的匹配程度,进而根据被检测文本与关键词集合的匹配程度得到检索结果。本发明实施例适合于对句子进行检索,或者适合于对较短的文字片段的检索,比如对微博进行检索。
本发明实施例中,一元词组指不可拆分的词语,词语中不存在修饰关系,比如,北京,中国;N元词组指该词组由N个一元词组构成。
下面结合附图对本发明实施例进行详细描述。
本发明实施例可应用于C/S(客户端/服务器)或B/S(浏览器/服务器)系统架构,其中,客户端用于发起信息检索请求以及接收信息检索结果,服务器端设置有智能检索系统,可为用户提供智能检索服务。
参见图1,为本发明实施例提供的智能检索流程示意图,该流程可由智能检索系统实现,该流程可包括:
步骤101,客户端向智能检索系统提交信息检索请求,其中携带有关键词。
具体实现时,用户可通过智能检索系统提供的检索界面输入关键词,并提交检索请求,其中携带有该关键词。
步骤102,智能检索系统接收该信息检索请求后,提取其中携带的关键词,并以该关键词为基础进行扩展(为描述方便,以下将该关键词称为原始关键词)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信集团公司,未经中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210124028.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:吸附装置、擦玻璃装置及其行走控制方法
- 下一篇:一种文件系统的存储方法及系统