[发明专利]一种提供检索关联词的方法及装置无效
申请号: | 201010618560.5 | 申请日: | 2010-12-31 |
公开(公告)号: | CN102567409A | 公开(公告)日: | 2012-07-11 |
发明(设计)人: | 吴周强;蔡勇;王彪;倪玉华;吴悠;彭德琦 | 申请(专利权)人: | 珠海博睿科技有限公司;北京师范大学珠海分校 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 519015 广东省珠海市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 提供 检索 关联词 方法 装置 | ||
技术领域
本发明涉及检索技术,特别涉及一种提供检索关联词的方法及装置。
背景技术
随着英特网上信息数据量的剧增,搜索引擎为了更好的服务于用户,就有必要采取辅助手段来提高搜索效率,而智能推荐检索关联词就是多种辅助手段中的一种。参阅图1所示,所谓智能推荐检索关联词,即是当用户输入某个检索关键字时,例如,人参,在搜索页面将会呈现出一系列可能与用户输入的检索关键字相关联的词汇,称为检索关联词,例如,如图1所示,人参果、人参健脾丸、人参娃娃......,点击这些检索关联词,用户可以进行进一步的搜索。
目前,支持智能推荐检索关联词的搜索引擎有很多,这此搜索引擎采用的推荐检索关联词方法通常包括以下几种:
但不同的搜索引擎完成这个功能的方式不同,通用的搜索引擎由于搜索人群非常广泛,涉猎的领域非常繁多,因此在推荐方面大都采用简单高效的推荐计算方式,常见的方式有:
1、系统关键字模糊匹配。
即在用户输入检索关键字后,根据预设的系统关键字库中记录的内容进行模糊匹配,并将模糊匹配成功的检索关键字作为检索关联词推荐给用户。
2、用户输入关键字模糊匹配。
即将用户输入的检索关键字保存至用户输入关键字库中并进行条数累计,当该用户输入检索关键字后,根据用户输入关键字库中记录的内容进行模糊匹配,并将模糊匹配成功的检索关键字按照累计次数排序,作为检索关联词推荐给用户。
3、参考其他用户输入的关键字进行推荐。
系统记录任何一个用户输入检索关键字的全过程并保存到用户输入关键字库中,用户输入检索关键字后,根据用户输入关键字库搜索匹配的检索关键字,并将以前输入这个检索关键字的用户输入的其它检索关键字,作为检索关键词推荐给用户。
然而,现有的搜索引擎在提供检索关联词时,没有考虑到检索关联词的行业特征,推荐的检索关联词一般是通用的关键字序列,并且,现有的搜索引擎通常采用模糊匹配的方式推荐检索关联词,这样,很多与检索关键字不存在模糊匹配关系,但存在一定逻辑关系的检索关联词将得不到推荐。例如,当用户输入的检索关键字为“人参”时,与“人参”存在一定逻辑关系的检索关联词“皂苷”,“黄芪”等等将得不到推荐,从而,在一定程度上影响了检索关联词的准确性,从而降低了搜索引擎的检索效率。
发明内容
本发明实施例公开一种提供检索关联词的方法及装置,用以提高检索关联词的准确性,提高搜索引擎的检索效率。
本发明实施例提供的具体技术方案如下:
一种提供检索关联词的方法,包括:
根据用户输入的检索关键字获取包含所述检索关键字的网页页面;
基于所述网页页面包含的文本数据提取出目标分词;
分别基于每一个目标分词在各网页页面中的密度,计算每一个目标分词与所述检索关键字之间的关联度;
将关联度达到设定门限值的目标分词,作为检索关联词呈现给用户。
一种提供检索关联词的装置,包括:
获取单元,用于根据用户输入的检索关键字获取包含所述检索关键字的网页页面;
提取单元,用于基于所述网页页面包含的文本数据提取出目标分词;
计算单元,用于分别基于每一个目标分词在各网页页面中的密度,计算每一个目标分词与所述检索关键字之间的关联度;
呈现单元,用于将关联度达到设定门限值的目标分词,作为检索关联词呈现给用户。
本发明实施例中,针对用户输入的检索关键字,不采用模糊匹配的方式获取检索关联词,而是基于检索关键字所在的网页页面包含的文本数据,提取出目标分词,再计算各目标分词与检索关键字之间的关联度,将关联度达到设定门限值的目标分词,作为检索关联词进行呈现,这样,便可以根据检索关键字所在的网页页面包含的信息内容,获取到与检索关键字存在逻辑上的关联关系,并且存在或不存在模糊匹配关系的其他检索关联词,从而提高了检索关联词的信息准确度,避免了部分检索关联词的遗漏,进而有效提高了搜索引擎的检索效率。
附图说明
图1为现有技术下智能推荐检索关联词示意图;
图2为本发明实施例中检索装置功能结构图;
图3为本发明实施例中建立推荐词库流程图;
图4为本发明实施例中向用户提供检索关联词流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海博睿科技有限公司;北京师范大学珠海分校,未经珠海博睿科技有限公司;北京师范大学珠海分校许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010618560.5/2.html,转载请声明来源钻瓜专利网。