[发明专利]进行数据搜索的方法及搜索服务器有效
申请号: | 201310370878.X | 申请日: | 2013-08-23 |
公开(公告)号: | CN104424215B | 公开(公告)日: | 2018-02-27 |
发明(设计)人: | 王顼;唐文宁;禹荣凌;岑植旺 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京德琦知识产权代理有限公司11018 | 代理人: | 周华霞,王丽琴 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 进行 数据 搜索 方法 服务器 | ||
1.一种进行数据搜索的方法,其特征在于,该方法包括:
从搜索日志中提取出设定时间段内的搜索记录;
从搜索记录中统计出对应查询词的特征参数,所述特征参数包括查询词被查询的总次数Qv和查询词对应的查询前驱行为为空的查询次数NoReferQv;
由查询词的特征参数确定查询词是否为异常查询词,所述异常查询词为机器操作输入的查询词;
对异常查询词进行标记,以使异常查询词不用于后续的搜索处理;
所述由查询词的特征参数确定查询词是否为异常查询词,包括:判断NoReferQv/Qv是否大于第一设定阈值,如果是,则将查询词确定为异常查询词。
2.如权利要求1所述的方法,其特征在于,所述特征参数还包括对查询词对应的查询结果有点击行为的查询次数CQv、查询词对应的搜索行为没有标明来源渠道的查询次数NoEentryQv、查询词对应的搜索行为来源渠道为特定渠道的查询次数SentryQv和查询词对应的URL信息中含有的标签与实际情况不相符合的次数URLQv中的至少一种。
3.如权利要求1所述的方法,其特征在于,所述特征参数还包括对查询词对应的查询结果有点击行为的查询次数CQv,判断NoReferQv/Qv不大于第一设定阈值之后,该方法还包括:
判断是否满足CQv/Qv小于第二设定阈值且Qv大于第三设定阈值,如果是,则将查询词确定为异常查询词。
4.如权利要求3所述的方法,其特征在于,所述判断NoReferQv/Qv是否大于第一设定阈值之前,该方法还包括:
判断Qv是否大于第四设定阈值,如果是,则执行所述判断NoReferQv/Qv是否大于第一设定阈值的步骤,第四设定阈值小于第三设置阈值;否则,将查询词确定为非异常查询词。
5.如权利要求3或4所述的方法,其特征在于,所述特征参数还包含查询词对应的搜索行为没有标明来源渠道的查询次数NoEentryQv,以及查询词对应的搜索行为来源渠道为特定渠道的查询次数SentryQv;判断不满足CQv/Qv小于第二设定阈值且Qv大于第三设定阈值之后,该方法还包括:
判断SentryQv/Qv是否大于第五设定阈值,如果是,则将查询词确定为异常查询词;否则判断NoEentryQv/Qv是否大于第六设定阈值,如果是,则将查询词确定为异常查询词。
6.如权利要求5所述的方法,其特征在于,所述特征参数还包含统一资源定位符URL信息错误次数URLQv,所述URLQv表示查询词对应的URL信息中含有的标签与实际情况不相符合的次数;所述判断NoEentryQv/Qv不大于第六设定阈值之后,该方法还包括:
判断URLQv/Qv是否大于第七设定阈值,如果是,则将查询词确定为异常查询词。
7.如权利要求1所述的方法,其特征在于,该方法还包括:
接收包含过程信息的查询过程输入信息;
从联想词库中获取与过程信息关联的联想词,去除其中标记为异常查询词的联想词,将剩余的联想词反馈给搜索客户端在智能提示栏中进行显示;
接收包含查询词的查询请求;
从相关搜索词库中获取与查询词关联的相关搜索词,反馈给搜索客户端在相关搜索栏中进行显示。
8.一种进行数据搜索的搜索服务器,其特征在于,该搜索服务器包括搜索记录提取单元、特征参数统计单元、异常查询词确定单元和标记单元;
所述搜索记录提取单元,从搜索日志中提取出设定时间段内的搜索记录,发送给所述特征参数统计单元;
所述特征参数统计单元,从搜索记录中统计出对应查询词的特征参数,发送给所述异常查询词确定单元,所述特征参数包括查询词被查询的总次数Qv和查询词对应的查询前驱行为为空的查询次数NoReferQv;
所述异常查询词确定单元,由查询词的特征参数确定查询词是否为异常查询词,所述异常查询词为机器操作输入的查询词;
所述标记单元,对异常查询词进行标记,以使异常查询词不用于后续的搜索处理;
所述异常查询词确定单元包括第一判断子单元,判断NoReferQv/Qv是否大于第一设定阈值,如果是,则将查询词确定为异常查询词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310370878.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种治疗心脑血管硬化的药方
- 下一篇:用于LED灯的散热器及具有其的灯具
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置