[发明专利]搜索行为的识别方法、装置以及用于搜索行为的识别装置有效

专利信息
申请号: 201711047614.5 申请日: 2017-10-31
公开(公告)号: CN110147479B 公开(公告)日: 2021-06-11
发明(设计)人: 齐鹏 申请(专利权)人: 北京搜狗科技发展有限公司
主分类号: G06F16/953 分类号: G06F16/953;G06F16/955
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 任苏亚;王宝筠
地址: 100084 北京市海淀区中关*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 搜索 行为 识别 方法 装置 以及 用于
【说明书】:

本申请提供了搜索行为的识别方法、装置以及用于搜索行为的识别装置,该识别方法包括:获取用户搜索行为的日志内容;日志内容包括:统一资源定位符URL、指向URL的搜索词以及搜索词指向URL的频次;所述搜索词指向URL的频次包括用户在搜索所述搜索词得到的搜索结果中点击所述URL的次数;依据所述搜索词指向URL的频次,对所述日志内容包括的搜索词进行分类,得到搜索词集合;依据各搜索词集合的相似度均值,识别所述搜索词集合中的搜索词指向的URL是否属于主动搜索行为。采用本申请实施例公开的方法或装置,能够准确的识别出哪些URL属于用户主动搜索行为中点击的URL,哪些URL属于用户被动搜索行为中点击的URL。

技术领域

本申请涉及搜索技术领域,特别涉及一种用户搜索行为的识别方法、装置,一种用于用户搜索行为的识别装置,一种用于用户搜索行为的识别装置,以及,一种计算机可读介质。

背景技术

随着互联网的发展,越来越多的用户使用搜索引擎来学习或者娱乐。用户可能会在输入框中键入搜索词进行搜索,来查找自己希望的内容;也可能会通过点击搜索引擎提供的相关词的链接等来进行搜索。对于用户自己输入搜索词的用户行为可以称为主动搜索行为,而对于用户没有输入搜索词而是通过直接点击链接等方式触发的搜索行为称为被动搜索行为。

发明内容

发明人在研究过程中发现,因为用户的主动搜索行为是用户自己输入的搜索词触发了搜索,所以主动搜索行为更能反映用户实际的搜索需求,也能反映出用户的搜索规律,例如都喜欢搜索哪一类别的新闻等。因此,如果能够识别出用户当前的搜索行为为主动搜索行为还是被动搜索行为,从而根据用户的主动搜索行为来分析用户需求,就能得到更准确的结果。

基于此,本申请提供了一种用户搜索行为的识别方案,从而利用属于主动搜索行为的URL对应的各个搜索词之间比较离散而属于被动搜索行为的URL对应的各个搜索词之间比较接近的规律,来对搜索日志中的搜索词、URL以及各搜索词指向各URL的频次进行分析,从而能够准确的识别出哪些URL属于用户主动搜索行为中点击的URL,哪些URL属于用户被动搜索行为中点击的URL。

本申请还提供了一种用户搜索行为的识别装置,用以保证上述方法在实际中的实现及应用。

本申请实施例公开了一种用户搜索行为的识别方法,该方法包括:

获取用户搜索行为的日志内容;所述日志内容包括:统一资源定位符URL、指向URL的搜索词以及搜索词指向URL的频次;所述搜索词指向URL的频次包括用户在搜索所述搜索词得到的搜索结果中点击所述URL的次数;

依据所述搜索词指向URL的频次,对所述日志内容包括的搜索词进行分类,得到搜索词集合;

依据各搜索词集合的相似度均值,识别所述搜索词集合中的搜索词指向的URL是否属于主动搜索行为。

其中,所述依据所述搜索词指向URL的频次,对所述日志内容包括的搜索词进行分类,得到搜索词集合,包括:

依据所述日志内容中各搜索词指向URL的频次,分别计算每一个搜索词与其他各个搜索词之间的相似度;

依据所述相似度对所述日志内容中的搜索词进行分类,得到搜索词集合。

其中,所述依据所述日志内容中各搜索词指向URL的频次,分别计算每一个搜索词与其他各个搜索词之间的相似度,包括:

按照不同搜索词指向同一个URL的频次越高,以及,不同搜索词分别指向所有URL的频次越低,则不同搜索词之间的相似度就越高的原则,分别计算每一个搜索词与其他各个搜索词之间的相似度。

其中,所述依据所述日志内容中各搜索词指向URL的频次,分别计算每一个搜索词与其他各个搜索词之间的相似度,包括:

遍历所述日志内容中搜索词构成的所有两两组合,计算得到每个两两组合中两个搜索词之间的相似度;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京搜狗科技发展有限公司,未经北京搜狗科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711047614.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top