[发明专利]资源处理方法、装置、设备及存储介质在审
申请号: | 202111559663.3 | 申请日: | 2021-12-20 |
公开(公告)号: | CN114461822A | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 张水发 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06F16/435 | 分类号: | G06F16/435;G06F16/45;G06F16/438;G06N3/04;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 贾允 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 资源 处理 方法 装置 设备 存储 介质 | ||
本公开关于一种资源处理方法、装置、设备及存储介质,该方法通过获取搜索字符和搜索字符对应的多个媒体资源;利用特征提取网络对搜索字符和多个媒体资源进行编码处理,基于编码所得的搜索特征和多个资源特征进行聚类,根据每个聚类所生成的聚类集对应的聚类特征与搜索特征,确定媒体资源的排列顺序;其中,该特征提取网络是基于搜索关系图和初始特征提取网络训练得到,搜索关系图包括搜索节点、资源节点和连接边,连接边表征被连接的搜索节点与资源节点之间匹配指标数据大于等于预设匹配指标数据阈值。如此通过无监督学习,能够很好的表示不同用户的需求,降低人工标记的样本量,提高资源处理的覆盖率。
技术领域
本公开涉及计算机技术领域,尤其涉及一种资源处理方法、装置、设备及存储介质。
背景技术
搜索多样性和用户需求是矛盾的两个需求,无法同时满足。例如,对于“传奇”这个搜索词,有的用户希望展示“传奇歌曲”,另一些用户希望展示“传奇游戏”,在满足一类用户需求的同时,必然会导致另一类用户的需求受到抑制。
相关技术中,采用分类网络来对媒体资源进行分类处理,以试图兼顾搜索多样性和用户需求。然而,该分类网络的训练过程依赖于人工标记的样本,不仅增加训练成本,而且更新速度较慢。此外,人工定义的类别数量有限,覆盖率较低。
发明内容
本公开提供一种资源处理方法、装置、设备及存储介质,以至少解决相关技术中依赖于人工标记的样本,更新速度慢以及覆盖率低等至少一种问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种资源处理方法,包括:
获取搜索字符和所述搜索字符对应的多个媒体资源;
利用特征提取网络对所述搜索字符和多个所述媒体资源进行编码处理,分别获得搜索特征和多个资源特征;
基于所述搜索特征和多个所述资源特征,对所述搜索字符和多个所述媒体资源进行聚类,获得多个聚类集;
基于每个所述聚类集对应的聚类特征与所述搜索字符对应的搜索特征,确定多个所述媒体资源对应的排列顺序;
其中,所述特征提取网络是基于搜索关系图和初始特征提取网络训练得到,所述搜索关系图包括搜索样本字符对应的搜索节点、搜索样本结果对应的资源节点、以及连接边,所述连接边表征被连接的搜索节点与资源节点之间匹配指标数据大于等于预设匹配指标数据阈值。
在一可选实施方式中,所述基于每个所述聚类集对应的聚类特征与所述搜索字符对应的搜索特征,确定多个所述媒体资源对应的排列顺序包括:
确定每个聚类集对应的聚类特征,与所述搜索字符对应的搜索特征之间的第一相似度;
基于第一相似度结果,确定多个所述媒体资源对应的排列顺序。
在一可选实施方式中,所述基于第一相似度结果,确定多个所述媒体资源对应的排列顺序包括:
基于第一相似度结果,确定多个所述聚类集对应的且用于指示集合间的第一级顺序;
基于每个聚类集中各媒体资源对应的资源特征与所述搜索特征,对每个聚类集中的各媒体资源进行排序处理,获得用于指示集合内的第二级顺序;
基于所述第一级顺序和所述第二级顺序,确定多个所述媒体资源对应的排列顺序。
在一可选实施方式中,所述基于每个所述聚类集中各媒体资源对应的资源特征与所述搜索特征,对每个聚类集中的各媒体资源进行排序处理,获得用于指示集合内的第二级顺序包括:
确定每个所述聚类集中各媒体资源对应的资源特征与所述搜索特征之间的第二相似度;
获取每个所述聚类集中各媒体资源对应的历史反馈数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111559663.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种轴类零件剁印加工后劲径检测方法
- 下一篇:一种电梯导轨