[发明专利]一种搜索关键词的挖掘方法和装置在审
| 申请号: | 201910591036.4 | 申请日: | 2019-07-02 |
| 公开(公告)号: | CN112182356A | 公开(公告)日: | 2021-01-05 |
| 发明(设计)人: | 王晓军;曲欣;彭兴强 | 申请(专利权)人: | 北京奇虎科技有限公司 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
| 代理公司: | 北京市隆安律师事务所 11323 | 代理人: | 权鲜枝 |
| 地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 搜索关键词 挖掘 方法 装置 | ||
本发明公开了一种搜索关键词的挖掘方法和装置。所述方法包括:获取用户的搜索行为日志;根据所述搜索行为日志识别出一组或多组相关联的搜索关键词;根据所述相关联的搜索关键词的搜索结果挖掘出待优化的搜索关键词。有益效果在于,可以快速且自动化的从用户行为日志中挖掘出用户对关键词搜索结果不满意的结果页,并通过横向对比所有搜索过该搜索关键词用户的满意度情况,最终挖掘出待优化的搜索关键词。为提升搜索引擎的评价口碑、用户使用粘性及活跃时间、用户整体满意度等方面提供了有力支持。而且面对海量的搜索结果,本发明采取的是机器自动化的快速处理方式,避免人工处理方式下成本高和效率低的问题,从而大幅提升了挖掘工作的效率。
技术领域
本发明涉及信息挖掘领域,具体涉及一种搜索关键词的挖掘方法和装置。
背景技术
用户对搜索引擎搜索结果的满意度指标将直接影响搜索引擎的评价口碑,进而影响用户的使用粘性和活跃时间,因此用户满意度指标对于搜索引擎优化有着重要的参考意义。但是搜索引擎的用户量和搜索结果数据量都极为庞大,采取人工方式挖掘和优化无法满足于现实应用的需求,因此需要一种利用机器快速且自动化的对搜索关键词挖掘的方法,应用于搜索关键词挖掘领域,以提升工作效率,并为改良用户使用体验提供支持。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种搜索关键词的挖掘方法和装置。
依据本发明的一个方面,提供了一种搜索关键词的挖掘方法,包括:
获取用户的搜索行为日志;
根据所述搜索行为日志识别出一组或多组相关联的搜索关键词;
根据所述相关联的搜索关键词的搜索结果挖掘出待优化的搜索关键词。
可选地,所述根据所述搜索行为日志识别出一组或多组相关联的搜索关键词包括:
根据所述搜索行为日志将用户的搜索行为按发生时间进行排序;
以预设的时间窗口进行滑动,判断时间窗口中相邻的两个搜索行为对应的搜索关键词是否为相关联的搜索关键词。
可选地,所述相关联的搜索关键词的语义存在关联关系;或者,后发生的搜索行为对应的搜索关键词为搜索引擎的名称。
可选地,所述根据所述相关联的搜索关键词的搜索结果挖掘出待优化的搜索关键词包括:
判断先发生的搜索行为对应的搜索关键词的搜索结果是否符合至少一项预设条件;
是则将先发生的搜索行为对应的搜索关键词作为待优化的搜索关键词。
可选地,所述预设条件包括如下的至少一种:
搜索结果首页中,第一类型的搜索结果数量大于预设阈值;
未出现第二类型的搜索结果;
第二类型的搜索结果排序在预设范围外;
搜索结果未被点击。
可选地,所述第一类型的搜索结果为广告。
可选地,所述第二类型的搜索结果为应用盒子onebox。
可选地,所述方法还包括:
记录各待优化的搜索关键词被挖掘的次数;
判断所述次数与搜索过该搜索关键词的用户总数的比值是否小于预设阈值,是则将该待优化的搜索关键词的优先级标记为高,否则标记为低。
依据本发明的另一方面,提供了一种搜索关键词的挖掘装置,包括:
获取单元,适于获取用户的搜索行为日志;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910591036.4/2.html,转载请声明来源钻瓜专利网。





