[发明专利]基于用户习惯性输入错误的查询纠错方法和装置无效
申请号: | 201210025834.9 | 申请日: | 2012-02-06 |
公开(公告)号: | CN103246576A | 公开(公告)日: | 2013-08-14 |
发明(设计)人: | 李超;宋国龙 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07;G06F17/30 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 用户 习惯性 输入 错误 查询 纠错 方法 装置 | ||
1.一种基于用户习惯性输入错误的查询纠错方法,其特征在于,包括:
从搜索引擎日志中选取待判定查询串,所述待判定查询串为使用频率大于预设的使用频率阈值的查询串;
从搜索引擎日志中搜索与所述待判定查询串相似的比对查询串,并将每个所述待判定查询串与其相应的比对查询串绑定为一个查询串组;
按照预设的过滤规则过滤所述查询串组;
将过滤后的查询串组与标准词库中的词语进行对比,从所述待判定查询串与比对查询串中选择出正确的查询串。
2.根据权利要求1所述的基于用户习惯性输入错误的查询纠错方法,其特征在于,所述预设的过滤规则,包括:
判断查询串组中的查询串是否为人名或者地名,若所述查询串组中存在一个为人名或者地名的查询串,则过滤掉该查询串组。
3.根据权利要求1所述的基于用户习惯性输入错误的查询纠错方法,其特征在于,所述预设的过滤规则,包括:
判断查询串组被其它查询串组所包含的次数是否小于预设的数量阈值,若小于预设的数量阈值,则过滤掉该查询串组。
4.根据权利要求1所述的基于用户习惯性输入错误的查询纠错方法,其特征在于,所述相似的比对查询串包括字形相似度大于预设值的查询串。
5.根据权利要求1所述的基于用户习惯性输入错误的查询纠错方法,其特征在于,所述相似的比对查询串包括具有与所述待判定查询串相同的注音结果的查询串。
6.一种基于用户习惯性输入错误的查询纠错装置,其特征在于,包括:
选取模块,用于从搜索引擎日志中选取待判定查询串,所述待判定查询串为使用频率大于预设的使用频率阈值的查询串;
查询串组建立模块,用于从搜索引擎日志中搜索与所述待判定查询串相似的比对查询串,并将每个所述待判定查询串与其相应的比对查询串绑定为一个查询串组;
过滤模块,用于按照预设的过滤规则过滤所述查询串组;
判别模块,用于将过滤后的查询串组与标准词库中的词语进行对比,从所述待判定查询串与比对查询串中选择出正确的查询串。
7.根据权利要求6所述的基于用户习惯性输入错误的查询纠错装置,其特征在于,所述预设的过滤规则,包括:
判断查询串组中的查询串是否为人名或者地名,若所述查询串组中存在一个为人名或者地名的查询串,则过滤掉该查询串组。
8.根据权利要求6所述的基于用户习惯性输入错误的查询纠错装置,其特征在于,所述预设的过滤规则,包括:
判断查询串组被其它查询串组所包含的次数是否小于预设的数量阈值,若小于预设的数量阈值,则过滤掉该查询串组。
9.根据权利要求6所述的基于用户习惯性输入错误的查询纠错装置,其特征在于,所述相似的比对查询串包括字形相似度大于预设值的查询串。
10.根据权利要求6所述的基于用户习惯性输入错误的查询纠错装置,其特征在于,所述相似的比对查询串包括具有与所述待判定查询串相同的注音结果的查询串。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210025834.9/1.html,转载请声明来源钻瓜专利网。