[发明专利]内容搜索方法、装置、电子设备及存储介质在审
申请号: | 202111272983.0 | 申请日: | 2021-10-29 |
公开(公告)号: | CN113918822A | 公开(公告)日: | 2022-01-11 |
发明(设计)人: | 张志伟;李岩;吴丽军 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9538;G06K9/62;G06N20/00 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 内容 搜索 方法 装置 电子设备 存储 介质 | ||
本公开关于一种内容搜索方法、装置、电子设备及存储介质,涉及数据处理技术领域。该方法包括:获取搜索词,并确定搜索词对应的多个搜索结果;读取预先存储的搜索词与至少两种类型的搜索结果之间的对应关系;对应关系是根据搜索词对应的用户满意值和被展示次数分别满足预设条件的历史搜索结果确定的;根据对应关系,从多个搜索结果中获取至少两种类型的目标搜索结果;显示目标搜索结果。
技术领域
本公开涉及数据处理技术领域,尤其涉及内容搜索方法、装置、电子设备及存储介质。
背景技术
相关技术中,大多数搜索系统都会引入点击之类的后验模型,这类搜索系统无论在召回还是排序阶段都更倾向于返回符合主流用户搜索需求的内容。例如,“传奇”这个搜索词,在某个应用场景下,绝大多数用户想搜索的是游戏传奇,那么在该场景下搜索“传奇”时,搜索系统无论在召回还是在排序阶段都更倾向于返回游戏传奇的内容。
显然,这种只关注主流用户搜索需求的行为,会导致其他用户的搜索需求无法得到满足,进而导致其他用户的搜索体验非常差。例如,对于那些想搜索歌曲传奇的用户,搜索体验就会非常差。
发明内容
本公开提供一种搜索场景下的内容搜索方法、装置、电子设备及存储介质,以至少解决相关技术中搜索系统只关注主流用户搜索需求,导致其他用户的搜索需求无法得到满足,进而导致其他用户的搜索体验非常差的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种内容搜索方法,包括:获取搜索词,并确定所述搜索词对应的多个搜索结果;读取预先存储的所述搜索词与至少两种类型的搜索结果之间的对应关系;所述对应关系是根据所述搜索词对应的用户满意值和被展示次数分别满足预设条件的历史搜索结果确定的;根据所述对应关系,从所述多个搜索结果中获取至少两种类型的目标搜索结果;显示所述目标搜索结果。
在一种可能的实施方式中,所述内容搜索方法还包括:获取预设时间段内所述搜索词对应的历史搜索结果,以及所述历史搜索结果的用户行为数据;对所述搜索词的每个历史搜索结果的用户行为数据进行聚合,得到所述每个历史搜索结果的用户满意值;获取用户满意值大于第一阈值、且被展示次数大于第二阈值的历史搜索结果,得到待标记样本;确定所述待标记样本中的每个历史搜索结果的类型,得到所述搜索词与至少两种类型的搜索结果之间的对应关系。
另一种可能的实施方式中,所述确定所述待标记样本中的每个搜索结果的类型,包括:根据所述待标记样本和图嵌入模型,构建图结构;所述图结构包括用于表征所述待标记样本中历史搜索结果的第一节点、用于表征所述搜索词的第二节点以及所述第一节点和所述第二节点的连接关系;根据所述图结构,确定所述待标记样本中每个历史搜索结果的类型。另一种可能的实施方式中,所述根据所述图结构,确定所述待标记样本中每个历史搜索结果的类型,包括:确定所述图结构的极大连通子图;获取节点数量小于预设阈值的极大连通子图,得到待标记子图;所述节点包括所述第一节点和所述第二节点;确定所述待标记子图中第一节点的类型。
另一种可能的实施方式中,所述根据所述图结构,确定所述待标记样本中每个历史搜索结果的类型,还包括:确定所述图结构中的第一节点的嵌入向量;根据所述嵌入向量和所述待标记子图中第一节点,确定待标记的第一节点;根据聚类算法,确定所述待标记的第一节点的类型。
另一种可能的实施方式中,所述对所述历史搜索词的每个搜索结果的用户行为数据进行聚合,得到所述每个历史搜索结果的用户满意值,包括:根据所述聚合后的用户行为数据,确定所述历史搜索结果的用户满意度;根据所述用户满足度,确定所述历史搜索结果的用户满意值。
另一种可能的实施方式中,所述根据所述聚合后的用户行为数据,确定所述历史搜索结果的用户满意度,包括:根据每个用户对所述历史搜索结果的每种用户行为数据,以及所述每种用户行为数据的权重系数,确定所述历史搜索结果的用户满意度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111272983.0/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法