[发明专利]一种基于查询词的检索方法及装置有效
申请号: | 201310167400.7 | 申请日: | 2013-05-08 |
公开(公告)号: | CN104142945B | 公开(公告)日: | 2018-05-04 |
发明(设计)人: | 谢可;苏上海;黄鹏 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 赵娟 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 查询 检索 方法 装置 | ||
技术领域
本申请涉及信息搜索的技术领域,特别是涉及一种基于查询词的检索方法,以及,一种基于查询词的检索装置。
背景技术
随着网络技术的发展和普及,能帮助用户在海量的网络资源中搜索其所需信息的搜索引擎技术也得到了大力发展和普及,目前,搜索引擎已成为每个网民不可缺少的上网工具之一。
一般而言,搜索引擎是基于用户提交的查询关键词进行检索,用户在搜索页面输入检索关键词(query),搜索引擎会采用该query在线上进行检索,判断是否有匹配的信息。然而,这样检索过程会导致处理的时间过长,因此,如何提高搜索引擎的搜索效率,成为本领域技术人员迫切需要解决的问题。
发明内容
本申请所要解决的技术问题是提供一种基于查询词的检索方法,用以提高检索效率。
相应的,本申请还提供了一种基于查询词的检索装置,用以保证上述方法在实际中的应用。
为了解决上述问题,本申请公开了一种基于查询词的检索方法,包括:
接收提交的查询词;
判断所述查询词是否存在于第一特征数据库中,其中所述第一特征数据库包括具有指定特征的关键词与对应目标网页数据的关联关系;
若是,则按照所述具有指定特征的关键词与对应目标网页数据的关联关系获取与所述查询词匹配的目标网页数据并返回。
优选地,所述方法还包括:
若所述查询词不存在于所述第一特征数据库中,从第二特征数据库中查找所述查询词,并返回与所述查询词匹配的目标网页数据,其中,所述第二特征数据库包括具有非指定特征的关键词与对应目标网页数据的关联关系;
其中,所述第二特征数据库通过如下方式生成:
获取预设时间段内的一个或多个查询词;
获取目标网页数据;
分别计算所述一个或多个关键词与目标网页数据的相关性;
依据所述相关性建立关键词和产品数据的对应关系;
从所述关键词和目标网页数据的对应关系中去除所述具有指定特征的关键词和目标网页数据的对应关系,将剩下的关键词和目标网页数据的对应关系作为具有非指定特征的关键词和目标网页数据的对应关系保存为第二特征数据库。
优选地,所述方法还包括:
若所述第二特征数据库中存在与所述查询词相同的具有非指定特征的关键词,在所述返回的目标网页数据被点击时,获取与所述目标网页数据对应的具有指定特征的关键词,建立所述具有非指定特征的关键词与具有指定特征的关键词的关联关系。
优选地,所述方法还包括:
若所述第二特征数据库中存在与所述查询词相同的具有非指定特征的关键词,将所述查询词作为候选的具有指定特征的关键词。
优选地,所述查询词包括提交的查询词以及依据所述提交的查询词生成的扩展查询词。
本申请还公开了一种基于查询词的检索装置,包括:
查询词接收模块,用于接收提交的查询词;
判断模块,用于判断所述查询词是否存在于第一特征数据库中,其中所述第一特征数据库包括具有指定特征的关键词与对应目标网页数据的关联关系;若是,则执行返回模块;
返回模块,用于按照所述具有指定特征的关键词与对应目标网页数据的关联关系获取与所述查询词匹配的目标网页数据并返回。
优选地,所述装置还包括:
查找模块,用于在所述查询词不存在于所述第一特征数据库中时,从第二特征数据库中查找所述查询词,并返回与所述查询词匹配的目标网页数据,其中,所述第二特征数据库包括具有非指定特征的关键词与对应目标网页数据的关联关系;
其中,所述第二特征数据库通过如下方式生成:
获取预设时间段内的一个或多个查询词;
获取目标网页数据;
分别计算所述一个或多个关键词与目标网页数据的相关性;
依据所述相关性建立关键词和产品数据的对应关系;
从所述关键词和目标网页数据的对应关系中去除所述具有指定特征的关键词和目标网页数据的对应关系,将剩下的关键词和目标网页数据的对应关系作为具有非指定特征的关键词和目标网页数据的对应关系保存为第二特征数据库。
优选地,所述装置还包括:
关联关系建立模块,用于若所述第二特征数据库中存在与所述查询词相同的具有非指定特征的关键词,在所述返回的目标网页数据被点击时,获取与所述目标网页数据对应的具有指定特征的关键词,建立所述具有非指定特征的关键词与具有指定特征的关键词的关联关系。
优选地,所述装置还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310167400.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:元数据动态管理方法及系统
- 下一篇:一种海量异构数据的接入及标准化方法