[发明专利]召回模型训练方法、搜索召回方法、装置和计算机设备有效
申请号: | 202111053840.0 | 申请日: | 2021-09-09 |
公开(公告)号: | CN113505204B | 公开(公告)日: | 2021-12-07 |
发明(设计)人: | 江宇鸥;李瑞方;邵昊阳;吴红升 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F16/31;G06N20/00;G06N3/08 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 董慧 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 召回 模型 训练 方法 搜索 装置 计算机 设备 | ||
本申请涉及一种召回模型训练方法、搜索召回方法、装置、计算机设备和存储介质,实施例可应用于云技术、人工智能、智慧交通等各种场景。该方法包括:获取训练搜索语句、对应的正向召回语句和反向召回语句集合;正向召回语句是训练搜索语句对应的目标召回语句集合中目标操作状态对应的召回语句,反向召回语句集合包括第一反向召回语句、第二反向召回语句和第三反向召回语句,第一反向召回语句是从候选召回语句集合中随机选取的,第二反向召回语句是目标召回语句集合中非目标操作状态对应的召回语句,第三反向召回语句对应的第一位置和正向召回语句对应的第二位置之间的位置差异满足预设条件,通过上述数据训练目标召回模型,可提高模型预测准确性。
技术领域
本申请涉及计算机技术领域,特别是涉及一种召回模型训练方法、搜索召回方法、装置、计算机设备和存储介质。
背景技术
随着互联网技术的快速发展,搜索引擎的功能也日趋强大。召回是搜索中的重要环节,根据用户输入的搜索语句可以从海量数据中召回与搜索语句相关的信息。
传统技术中,可以训练一个机器学习模型,利用机器学习模型来确定搜索语句和候选信息的相似度,从而基于相似度从海量的候选文本中筛选出目标信息作为召回结果。然后,通常是采取随机采样方式获得模型训练样本中的负样本,基于这样的负样本训练出的模型只能学到粗粒度上的差异,存在预测准确性低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高模型的预测准确性的召回模型训练方法、搜索召回方法、装置、计算机设备和存储介质。
一种召回模型训练方法,所述方法包括:
获取训练搜索语句和对应的正向召回语句;所述正向召回语句是所述训练搜索语句对应的目标召回语句集合中目标操作状态对应的召回语句;
获取所述训练搜索语句对应的反向召回语句集合;所述反向召回语句集合包括第一反向召回语句、第二反向召回语句和第三反向召回语句,所述第一反向召回语句是从候选召回语句集合中随机选取的,所述第二反向召回语句是所述目标召回语句集合中非目标操作状态对应的召回语句,所述第三反向召回语句对应的第一位置和所述正向召回语句对应的第二位置之间的位置差异满足预设条件;
基于所述训练搜索语句、所述正向召回语句和所述反向召回语句集合对待训练的目标召回模型进行模型训练,得到已训练的目标召回模型;所述已训练的目标召回模型用于对目标搜索语句进行搜索召回。
在一个实施例中,所述预设条件为所述第一位置和所述第二位置处于同一目标位置区域中,所述目标位置区域是地图中目标等级对应的位置区域,所述地图包括多级递进的位置区域。
在一个实施例中,所述目标召回模型包括搜索语句分析网络和召回语句分析网络;所述基于所述训练搜索语句、所述正向召回语句和所述反向召回语句集合对待训练的目标召回模型进行模型训练,得到已训练的目标召回模型,包括:
将所述训练搜索语句和当前召回语句分别输入所述搜索语句分析网络和所述召回语句分析网络,得到搜索训练向量和召回训练向量;基于搜索训练向量和正向召回语句对应的召回训练向量计算正向相似度;基于搜索训练向量和所述反向召回语句集合中各个反向召回语句对应的召回训练向量计算各个反向相似度;基于正向相似度和各个反向相似度计算训练损失,基于所述训练损失调整所述目标召回模型的模型参数,直至满足收敛条件,得到所述已训练的目标召回模型。
在一个实施例中,将所述训练搜索语句和当前召回语句分别输入所述搜索语句分析网络和所述召回语句分析网络,得到搜索训练向量和召回训练向量,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111053840.0/2.html,转载请声明来源钻瓜专利网。