[发明专利]一种查询请求处理方法有效
| 申请号: | 201810420899.0 | 申请日: | 2018-05-04 |
| 公开(公告)号: | CN108984582B | 公开(公告)日: | 2023-07-28 |
| 发明(设计)人: | 左晓栋;崔占华;杨晨;张弛;王石;刘雨桁;周亚超 | 申请(专利权)人: | 中国信息安全研究院有限公司 |
| 主分类号: | G06F16/953 | 分类号: | G06F16/953 |
| 代理公司: | 北京安博达知识产权代理有限公司 11271 | 代理人: | 徐国文 |
| 地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 查询 请求 处理 方法 | ||
1.一种查询请求处理方法,其特征在于,该方法包括如下步骤:
S1:接收用户查询请求以获取关键词有序组;
所述步骤S1具体为,对查询请求中查询内容的类型进行判断,如果查询内容为一个或多个关键词,则直接基于所述查询内容获取关键词有序组;如果查询内容为一个或多个句子,则对句子进行逐个处理以获取关键词有序组;
所述直接基于所述查询内容获取关键词有序组,具体为:直接将查询内容中包含的一个或多个关键词按照其在查询请求中的先后顺序存放到关键词有序组中;
所述对句子进行逐个处理以获取关键词有序组,具体为:依次对每个句子进行词划分,以获取一个或多个词,删除其中第一类型的词而保留第二类型的词,将第二类型的词按预设排序规则进行排序,并将排序后的词按顺序放入关键词有序组中;对于多个句子获取的多个关键词有序组,将所述多个关键词有序组合并成一个关键词有序组作为关键词有序组;
所述将所述多个关键词有序组合并成一个关键词有序组,具体为:将多个关键词有序组按照其对应的句子出现的先后顺序放入合并后的关键词有序组;合并后对于重复出现的关键词进行去重复,删除排序靠后的关键词而保留排序靠前的关键词,对于排序靠前的关键词进行向前移动;
S2:对关键词有序组进行处理,以获取中间关键词有序组;
所述步骤S2具体为:对关键词有序组进行处理,以获取中间关键词有序组;具体为:将所述关键词有序组和通用有序组进行比较以获取中间关键词有序组;
所述将所述关键词有序组和通用有序组进行比较以获取中间关键词有序组,具体为:计算关键词有序组和通用有序组的通用相似度,如果存在一通用有序组,其和关键词有序组之间的通用相似度大于第一相似度阈值,则基于所述一通用有序组对关键词有序组进行修正;
所述计算关键词有序组和通用有序组的通用相似度,具体为:对于每个通用有序组,获取所述通用有序组中和所述关键词有序组所包含的相同关键词的个数,将所述个数和关键词有序组中所有关键词的个数的比值作为所述通用相似度;
所述第一相似度阈值为100%;
当大于第一相似度阈值的通用有序组的个数为多个时,随机选择一个通用有序组作为所选择的一个通用有序组;
所述基于所述一通用有序组对关键词有序组进行修正,具体为:如果关键词有序组中关键词的个数小于等于所述一通用有序组中关键词的个数,则不进行修正;否则,在所述一通用有序组中选择一关键词加入所述关键词有序组中;
所述选择一关键词加入所述通用有序组中,具体为:在所述一通用有序组中包含的相同关键词相邻的所有关键词中,选择排序最靠前的相邻关键词作为所选择的关键词;将所述所选择的关键词放入所述关键词有序组中尾部的位置;
所述通用有序组为基于大数据获取,通过对多用户查询请求进行分析,将预定时间段内出现次数较多的关键词有序组作为通用有序组;
S3:基于所述中间关键词有序组进行基于搜索引擎的查询。
2.根据权利要求1所述的查询请求处理方法,其特征在于,当一关键词的出现次数超过次数阈值时,将所述关键词的排序向前移动。
3.根据权利要求2所述的查询请求处理方法,其特征在于,所述向前移动具体为:向前移动一次。
4.根据权利要求3所述的查询请求处理方法,其特征在于,当一个关键词的出现次数为n时,将所述关键词的排序向前移动的次数为 。
5.根据权利要求4所述的查询请求处理方法,其特征在于,当关键词已经位于第一位时,不再移动。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国信息安全研究院有限公司,未经中国信息安全研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810420899.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据融合方法
- 下一篇:一种基于日志文件的搜索方法





