[发明专利]排序模型的训练方法、装置、电子设备及存储介质有效
申请号: | 202010307729.9 | 申请日: | 2020-04-17 |
公开(公告)号: | CN113535829B | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 范言;李晨放 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/248 | 分类号: | G06F16/248;G06F16/2455;G06K9/62 |
代理公司: | 北京智信四方知识产权代理有限公司 11519 | 代理人: | 钟文芳;宋海龙 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 排序 模型 训练 方法 装置 电子设备 存储 介质 | ||
本公开实施例公开了一种排序模型的训练方法、装置、电子设备及存储介质,该方法包括:获取样本数据对;利用排序模型对第一查询内容与第一查询结果之间的相关性进行多分类预测,得到第一相关性预测结果,以及对第一查询内容与第二查询结果之间的相关性进行多分类预测,得到第二相关性预测结果;利用第一损失函数拟合第一相关性预测结果与第一相关性等级之间的第一损失,以及拟合第二相关性预测结果与第二相关性等级之间的第二损失;根据第一相关性预测结果和第二相关性预测结果确定相关性预测比较结果;利用第二损失函数拟合相关性预测比较结果与相关性等级比较结果之间的第三损失;根据第一损失、第二损失以及第三损失调整排序模型的模型参数。
技术领域
本公开涉及计算机技术领域,具体涉及一种排序模型的训练方法、装置、电子设备及存储介质。
背景技术
查询结果的排序系统通常会根据用户的查询内容(可以称为query)和搜索引擎根据查询内容所召回的查询结果(例如文档,可以称为doc)之间的相关性关系,对查询结果进行排序。搜索引擎通过判断是否包含查询内容中的关键词的方式能够召回成千上万的查询结果,为了提高查询结果的精准性以及可读性,需要对这些查询结果进行排序。衡量查询内容与查询结果之间的相关性是排序系统的核心部分。随着时代与科技的进步,查询内容与查询结果之间的相关性的衡量方法已逐步由最开始简单的词语规则发展成为了机器学习算法,使得相关性排序变得更为精确和可控。
发明内容
本公开实施例提供一种排序模型的训练方法、装置、电子设备及计算机可读存储介质。
第一方面,本公开实施例中提供了一种排序模型的训练方法,包括:
获取样本数据对;其中,所述样本数据对包括第一样本和第二样本,所述第一样本包括第一查询内容以及与所述第一查询内容具有第一相关性等级的第一查询结果,第二样本包括第一查询内容以及与所述第一查询内容具有第二相关性等级的第二查询结果;所述第一相关性等级不同于所述第二相关性等级;
利用排序模型对所述第一查询内容与所述第一查询结果之间的相关性进行多分类预测,得到第一相关性预测结果,以及利用排序模型对所述第一查询内容与所述第二查询结果之间的相关性进行多分类预测,得到第二相关性预测结果;
利用第一损失函数拟合所述第一相关性预测结果与所述第一相关性等级之间的第一损失,以及拟合所述第二相关性预测结果与所述第二相关性等级之间的第二损失;
根据所述第一相关性预测结果和第二相关性预测结果确定相关性预测比较结果;所述相关性预测比较结果用于表示所述第一查询结果和所述第二查询结果的相关性高低比较结果;
利用第二损失函数拟合所述相关性预测比较结果与相关性等级比较结果之间的第三损失;所述相关性等级比较结果为所述第一相关性等级和所述第二相关性等级之间的比较结果;
根据第一损失、第二损失以及第三损失调整所述排序模型的模型参数。
进一步地,获取样本数据对,包括:
获取所述第一查询内容、与所述第一查询内容相关的多个候选查询结果以及所述多个候选查询结果的相关性标注;所述相关性标注用于表示所述候选查询结果与所述第一查询内容的相关性等级;
根据所述相关性标注将相关性等级不同的所述候选查询结果进行两两组合,得到所述第一查询结果和所述第二查询结果。
进一步地,利用排序模型对所述第一查询内容与所述第一查询结果之间的相关性进行多分类预测,得到第一相关性预测结果,以及利用排序模型对所述第一查询内容与所述第二查询结果之间的相关性进行多分类预测,得到第二相关性预测结果,包括:
对所述第一查询内容和所述第一查询结果组成的第一文本进程切词,得到第一分词集合,以及对所述第一查询内容和所述第一查询结果组成的第二文本进行切词,得到第二分词集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010307729.9/2.html,转载请声明来源钻瓜专利网。