[发明专利]排序模型生成方法、排序方法、装置、电子设备有效
申请号: | 202110755441.2 | 申请日: | 2021-07-05 |
公开(公告)号: | CN113254513B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 张水发 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06F16/248 | 分类号: | G06F16/248;G06F16/9538;G06F16/738 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 唐敏 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 排序 模型 生成 方法 装置 电子设备 | ||
本公开关于一种排序模型生成方法、排序方法、装置、电子设备。所述排序模型生成方法包括:对初始样本集合中多个初始搜索结果进行多维度特征分析,确定待优化特征维度;根据待优化特征维度补充与各个初始搜索结果对应的虚拟搜索结果;确定多个初始搜索结果的第一排序结果,根据第一排序结果确定虚拟搜索结果的第二排序结果;将初始搜索结果和虚拟搜索结果进行配对生成输入样本,根据第一排序结果和第二排序结果确定样本标签,对待训练的排序模型进行训练,得到排序模型。根据本公开的方案,利用初始搜索结果和虚拟搜索结果构建更多的输入样本,使模型能够学习到更多的特征信息和相对顺序,从而让模型具备更强的性能,有助于提高模型的排序精度。
技术领域
本公开涉及计算机技术领域,尤其涉及一种排序模型生成方法、排序方法、装置、电子设备、计算机可读存储介质、计算机程序产品。
背景技术
排序学习是搜索算法中的重要一环。随着互联网技术的快速发展,准确搜索与用户账户更加匹配的对象成为目前的热门话题。
搜索的过程可以分为粗排和精排。粗排是指自动选取与用户输入的搜索词(query)最相关的一组搜索结果的过程。精排是指通过预训练的排序模型对粗排得到的一组搜索结果进行精确排序的过程。相关技术中,通过排序模型实现精确排序可以采用文档对(pairwise)方法。在这种情况下,排序模型通常以人工标注样本作为排序的主要依据,使排序模型能够在训练过程中学习人工标注样本之间的相对顺序。但是,在对排序模型进行训练的过程中,常常会发生由于训练样本在某个或多个特征维度覆盖不够而导致的排序模型效果不佳,进而导致排序模型的排序准确率较低的问题。
发明内容
本公开提供一种排序模型生成方法、排序方法、装置、电子设备、计算机可读存储介质、计算机程序产品,以至少解决相关技术中由于训练样本在某个或多个特征维度覆盖不够而导致的推荐准确率较低的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种排序模型生成方法,包括:
获取初始样本集合,所述初始样本集合中包括待进行排序的多个初始搜索结果;
对多个所述初始搜索结果进行多维度特征分析,确定特征值分布不均的待优化特征维度;
根据所述待优化特征维度,补充与各个所述初始搜索结果对应的虚拟搜索结果,以使所述初始搜索结果和所述虚拟搜索结果在所述待优化特征维度下的特征值分布均匀;
确定多个所述初始搜索结果的第一排序结果,并根据所述第一排序结果确定所述虚拟搜索结果的第二排序结果;
将所述初始搜索结果和所述虚拟搜索结果进行配对生成输入样本,根据所述第一排序结果和所述第二排序结果确定所述输入样本的样本标签,对待训练的排序模型进行训练,得到排序模型。
在其中一个实施例中,所述确定多个所述初始搜索结果的第一排序结果,并根据所述第一排序结果确定所述虚拟搜索结果的第二排序结果包括:
根据针对各个所述初始搜索结果的第一排序标记结果,对多个所述初始搜索结果进行分档排序,得到第一档间排序结果,作为所述第一排序结果;其中,所述第一档间排序结果包括多个档位,每一档位包括至少一个初始搜索结果;
根据针对所述虚拟搜索结果与对应的所述初始搜索结果的第二排序标记结果,确定所述虚拟搜索结果与对应的所述初始搜索结果之间的升序关系或降序关系;
根据所述虚拟搜索结果与对应的所述初始搜索结果之间的升序关系或降序关系,以及所述第一档间排序结果,确定所述虚拟搜索结果与多个所述初始搜索结果的第二档间排序结果,作为所述第二排序结果。
在其中一个实施例中,所述根据所述虚拟搜索结果与对应的所述初始搜索结果之间的升序关系或降序关系,以及所述第一档间排序结果,确定所述虚拟搜索结果与多个所述初始搜索结果的第二档间排序结果,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110755441.2/2.html,转载请声明来源钻瓜专利网。