[发明专利]基于用户习惯性输入错误的查询纠错方法和装置无效
申请号: | 201210025834.9 | 申请日: | 2012-02-06 |
公开(公告)号: | CN103246576A | 公开(公告)日: | 2013-08-14 |
发明(设计)人: | 李超;宋国龙 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07;G06F17/30 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 用户 习惯性 输入 错误 查询 纠错 方法 装置 | ||
技术领域
本发明涉及网络技术领域,尤其涉及一种基于用户习惯性输入错误的查询纠错方法和装置。
背景技术
在使用搜索引擎进行搜索的过程中,用户所输入的词语等内容,有可能含有错别字等错误的内容。据统计,有10%~15%的用户输入的原始查询是含有错误的,而其中有一些错误很有可能跟其相应的同音形式混淆,用户自己也很难判断是否正确,例如: “登录网站”和“登陆网站”,那么“登录网站”这样的查询串就构成了一个用户的习惯性输入错误。对于一些明显的词语错误,如“平果电脑”和“苹果电脑”,搜索引擎可以很容易的判断出用户输入有误,但对于一些不易识别的词语错误,如, “登录网站”和“登陆网站”,搜索引擎就不能准确的判断出用户是否输入正确。因此,如何准确的判断出用户的习惯性输入错误并给以正确的输入提示,成为搜索引擎急需解决的一个问题。
发明内容
本发明的实施例所要解决的技术问题在于提供一种基于用户习惯性输入错误的查询纠错方法和装置,能够准确的判断出用户的习惯性输入错误,从而提高搜索准确度。
为解决上述技术问题,本发明的实施例采用如下技术方案:
一种基于用户习惯性输入错误的查询纠错方法,包括:
从搜索引擎日志中选取待判定查询串,所述待判定查询串为使用频率大于预设的使用频率阈值的查询串;
从搜索引擎日志中搜索与所述待判定查询串相似的比对查询串,并将每个所述待判定查询串与其相应的比对查询串绑定为一个查询串组;
按照预设的过滤规则过滤所述查询串组;
将过滤后的查询串组与标准词库中的词语进行对比,从所述待判定查询串与比对查询串中选择出正确的查询串。
一种基于用户习惯性输入错误的查询纠错装置,包括:
选取模块,用于从搜索引擎日志中选取待判定查询串,所述待判定查询串为使用频率大于预设的使用频率阈值的查询串;
查询串组建立模块,用于从搜索引擎日志中搜索与所述待判定查询串相似的比对查询串,并将每个所述待判定查询串与其相应的比对查询串绑定为一个查询串组;
过滤模块,用于按照预设的过滤规则过滤所述查询串组;
判别模块,用于将过滤后的查询串组与标准词库中的词语进行对比,从所述待判定查询串与比对查询串中选择出正确的查询串。
本实施例的基于用户习惯性输入错误的查询纠错方法和装置,通过设定使用频率阈值、过滤等步骤筛选用户习惯性输入错误的查询串,再通过将过滤后的查询串组与标准词库中的词语进行对比,得到正确的查询串,当用户再次输入错误的形式的查询串时,搜索引擎提示给用户正确的形式,从而有效引导用户搜索到想要得到的结果,提高用户的搜索满意程度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中基于用户习惯性输入错误的查询纠错方法的流程示意图;
图2为本发明实施例中基于用户习惯性输入错误的查询纠错的示意图。
具体实施方式
本发明实施例提供一种基于用户习惯性输入错误的查询纠错方法和装置,能够有效引导用户输入正确的查询串,提高用户的搜索满意程度。
下面结合附图对本发明实施例做详细描述。
实施例一
本实施例提供一种基于用户习惯性输入错误的查询纠错方法,如图1所示,该方法包括:
步骤101、从搜索引擎日志中选取待判定查询串,所述待判定查询串为使用频率大于预设的使用频率阈值的查询串。
搜索引擎日志是指用户向搜索引擎输入的查询串的记录。本发明的发明主要针对用户习惯性输入错误,即用户在搜索过程中经常出现的输入错误。因此本发明预设了使用频率阈值,当所选取的待判定查询串的使用频率大于预设的使用频率阈值时,该查询串才会成为本发明纠错的对象。此外,设置使用频率阈值还可以防止因用户的偶然输入错误带来不必要的工作量。
步骤102、从搜索引擎日志中搜索与所述待判定查询串相似的比对查询串,并将每个所述待判定查询串与其相应的比对查询串绑定为一个查询串组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210025834.9/2.html,转载请声明来源钻瓜专利网。