[发明专利]一种搜索处理方法、装置、电子设备及存储介质在审
申请号: | 202111602698.0 | 申请日: | 2021-12-24 |
公开(公告)号: | CN114547421A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 侯舜琪;朱晓旭;王建强;孔莹 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953;G06F16/906 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 李娜 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搜索 处理 方法 装置 电子设备 存储 介质 | ||
本公开关于一种搜索处理方法、装置、电子设备及存储介质,包括:获取多个搜索词及每个搜索词的搜索时间;根据搜索词的搜索时间及特征信息,将搜索词对应的搜索操作划分至多个意图切片;检测在每个搜索词对应的搜索操作的搜索结果页面中的操作信息,在检测到预设操作信息的情况下,将对应的搜索操作确定为目标搜索操作,根据目标搜索操作的数量及目标搜索操作在所属的意图切片中的搜索次序,确定搜索步长。这样,采取意图切片的方式去界定用户意图相同的一段连续行为,对于用户行为的理解更加贴近实际,可以提高搜索处理结果的准确度,满足较为复杂的搜索场景。
技术领域
本公开涉及数据搜索领域,尤其涉及一种搜索处理方法、装置、电子设备及存储介质。
背景技术
在网站的搜索业务里,用户的核心诉求往往是“以最快的速度搜索到结果”,因此,网站需要对用户的搜索效率进行统计,对于当前效率低的搜索场景进行归因,并进一步去拆解效率低的问题以优化网站的搜索效率。
现有技术中,通常根据综合页第一位置搜索结果有点比及特定内容垂直搜索页的首次点击位置来确定搜索效率,其中,综合页第一位置搜索结果有点比是指在综合页曝光至少一个搜索结果的情况下,有多大的概率会在第一个位置的搜索结果上发生点击,特定内容垂直搜索页的首次点击位置是指在特定内容垂直搜索页上,平均发生用户结果点击的位置。
但是,上述确定搜索效率的方式视角较为孤立,仅考虑单次搜索的效率,而在一些情况下,如果用户第一次搜索没有得到满意的搜索结果,直到第二次换了一个意图相近的搜索词找到了满意的搜索结果,这实际上是一种较为负向的体验,但是在当前的衡量体系下是无法反映出来的。因此,目前的搜索处理方法得到的搜索处理结果准确度有限,难以满足较为复杂的搜索场景。
发明内容
本公开提供一种搜索处理方法、装置、电子设备及存储介质,以至少解决相关技术中搜索处理结果准确度有限,难以满足较为复杂的搜索场景的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种搜索处理方法,包括:
获取多个搜索词及每个搜索词的搜索时间;
根据所述搜索词的搜索时间及特征信息,将所述搜索词对应的搜索操作划分至多个意图切片;
检测在每个搜索词对应的搜索操作的搜索结果页面中的操作信息,在检测到预设操作信息的情况下,将对应的搜索操作确定为目标搜索操作,根据所述目标搜索操作的数量及所述目标搜索操作在所属的意图切片中的搜索次序,确定搜索步长。
可选的,所述根据所述搜索词的搜索时间及特征信息,将所述搜索词对应的搜索操作划分至多个意图切片,包括:
针对每个搜索词,计算当前搜索词的搜索时间与上一个搜索词的搜索时间之间的差值;
根据所述当前搜索词的特征信息及所述差值,判断所述当前搜索词与所述当前搜索词的上一个搜索词是否满足匹配条件;
若满足,将所述当前搜索词对应的搜索操作添加至所述当前搜索词的上一个搜索词对应的搜索操作所属的意图切片。
可选的,所述根据所述当前搜索词的特征信息及所述差值,判断所述当前搜索词与所述当前搜索词的上一个搜索词是否满足匹配条件,包括:
将所述当前搜索词的特征信息及所述差值输入至预先训练得到的意图切片分类模型中进行处理,根据分类结果判断所述当前搜索词与所述当前搜索词的上一个搜索词是否满足匹配条件。
可选的,所述当前搜索词的特征信息,包括以下至少一项:
所述当前搜索词的核密度估计值;
所述当前搜索词与所述当前搜索词的上一个搜索词之间的余弦相似度;
所述当前搜索词与所述当前搜索词的下一个搜索词之间的余弦相似度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111602698.0/2.html,转载请声明来源钻瓜专利网。