[发明专利]一种模型训练的方法、装置、存储介质及电子设备在审
| 申请号: | 202310264180.3 | 申请日: | 2023-03-10 | 
| 公开(公告)号: | CN116401541A | 公开(公告)日: | 2023-07-07 | 
| 发明(设计)人: | 苗书宇;郑霖;金宏 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 | 
| 主分类号: | G06F18/214 | 分类号: | G06F18/214;G06N20/00;G06Q10/0635 | 
| 代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 李威 | 
| 地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 模型 训练 方法 装置 存储 介质 电子设备 | ||
本说明书公开了一种模型训练的方法、装置、存储介质和电子设备,将获取的样本业务数据输入第一模型,获得第一模型输出的第一风控结果,将该样本业务数据分别输入各第二模型,确定该样本业务数据的特征,将该特征输入适应层,确定每个第二模型分别对应的权重,并获得每个第二模型输出的第二风控结果,利用该权重及该第二风控结果确定伪标签,根据该伪标签以及该第一风控结果,对该适应层及该第一模型进行训练,训练后的第一模型用于对待风控业务数据进行风险判断。本方法通过适应层确定各第二模型的权重,根据权重及第二风控结果确定伪标签,根据伪标签及第一风控结果,训练适应层及第一模型,提高了第一模型输出结果的准确性。
技术领域
本说明书涉机器学习领域,尤其涉及一种模型训练的方法、装置、存储介质及电子设备。
背景技术
随着互联网技术的发展,人们能够利用训练的模型对用户执行的各类业务进行风控,其中,训练模型所使用的训练样本可能包含个人隐私数据。通常情况下,训练的模型可部署在服务器或者客户端上,若将训练的模型部署在客户端上,则要求模型尽量轻量化,减轻客户端的计算负担。例如,将模型结构较为复杂的模型作为教师模型,将模型结构较为简单的模型作为学生模型,通过教师模型对学生模型进行蒸馏,将蒸馏后的学生模型部署在客户端上,用于对用户执行的各类业务进行风控。
此外,在模型的实际应用过程中,可能不仅需要确定用户执行的业务是否具有风险,还需要确定用户执行的业务具有何种类型的风险,因此,需要多种模型判断用户执行的业务是否具有风险,以及确定各模型输出结果中准确性较高的结果对应的风险类型,也就是说,需要多个教师模型对一个学生模型进行蒸馏。由于教师模型的输出结果会影响学生模型输出的结果,因此,如何在多个教师模型的输出结果作为监督信号的条件下,使得学生模型的输出结果的更加准确是个亟待解决的问题。
基于此,本说明书提供一种模型训练的方法。
发明内容
本说明书提供一种模型训练的方法、装置、存储介质及电子设备,以至少部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供一种模型训练的方法,包括:
获取样本业务数据;
将所述样本业务数据输入第一模型,获得第一模型输出的对所述业务数据的第一风控结果;并,将所述样本业务数据分别输入各第二模型,以通过所述各第二模型确定所述样本业务数据的特征,将所述特征输入适应层,以通过所述适应层确定每个第二模型在所述样本业务数据作为输入的条件下分别对应的权重,并基于所述特征获得每个第二模型输出的对所述样本业务数据的第二风控结果;
利用所述权重对所述第二风控结果进行加权,作为伪标签;
根据所述伪标签以及所述第一风控结果,对所述适应层及所述第一模型进行训练,训练后的第一模型用于对待风控业务数据进行风险判断。
可选地,根据所述伪标签以及所述第一风控结果,对所述适应层及所述第一模型进行训练,具体包括:
根据所述伪标签以及所述第一风控结果,确定所述伪标签以及所述第一风控结果的差异,作为第一损失;
以最小化所述第一损失为训练目标,调整所述适应层及所述第一模型的参数。
可选地,根据所述伪标签以及所述第一风控结果,对所述适应层及所述第一模型进行训练,具体包括:
根据所述样本业务数据,确定所述样本业务数据对应的业务的风险类型的真标签;
根据所述真标签、所述伪标签以及所述第一风控结果,对所述适应层及所述第一模型进行训练。
可选地,根据所述真标签、所述伪标签以及所述第一风控结果,对所述适应层及所述第一模型进行训练,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310264180.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:索引查找方法、系统、电子设备及可读存储介质
- 下一篇:一种数据处理方法及装置





