[发明专利]一种模型线上更新方法及装置在审
申请号: | 202111397100.9 | 申请日: | 2021-11-23 |
公开(公告)号: | CN114091670A | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 李志峰;孟昌华;王维强 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06N5/00 | 分类号: | G06N5/00;G06N20/20;G06K9/62 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 周嗣勇 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 线上 更新 方法 装置 | ||
本说明书公开了一种模型线上更新方法及装置。所述方法包括:获取预设树模型的副本和新训练样本集合;所述预设树模型为:当前线上运行的提升树模型或当前线上运行的梯度提升决策树模型;将所述副本当前的叶子节点输出值确定为旧叶子节点输出值;在保持所述副本结构不变的情况下,根据所述新训练样本集合更新所述副本的叶子节点输出值,将更新后的叶子节点输出值确定为新叶子节点输出值;针对所述副本的每个叶子节点,计算对应的新叶子节点输出值和对应的旧叶子节点输出值的加权和,并将该叶子节点的输出值更新为所述加权和,得到新的副本树模型;将所述新的副本树模型部署到线上,所述新的副本树模型用于在预设情况下替换所述预设树模型。
技术领域
本说明书实施例涉及计算机应用技术领域,尤其涉及一种模型线上更新方法及装置。
背景技术
目前,提升树模型和梯度提升决策树模型广泛应用于多种业务场景中,例如欺诈识别场景。而这类树模型在上线后,可能存在模型衰退的问题。例如,针对新数据的预测效果较差等。
为了应对模型衰退的问题,可以利用新数据对线上运行的树模型进行更新。通常需要对线上运行的树模型进行离线处理,再进行更新。
而在离线更新的过程中,会导致线上树模型的相关业务暂停,降低了业务处理效率。
发明内容
为了解决上述技术问题,本说明书实施例提供了一种模型线上更新方法及装置。技术方案如下所示。
第一方面,本说明书实施例提供了一种模型线上更新方法,具体包括以下步骤:
获取预设树模型的副本和新训练样本集合;所述预设树模型为:当前线上运行的提升树模型或当前线上运行的梯度提升决策树模型;
将所述副本当前的叶子节点输出值确定为旧叶子节点输出值;
在保持所述副本结构不变的情况下,根据所述新训练样本集合更新所述副本的叶子节点输出值,将更新后的叶子节点输出值确定为新叶子节点输出值;
根据对所述新训练样本集合的关注程度,确定所述新叶子节点输出值的第一权重和所述旧叶子节点输出值的第二权重;
利用所确定的第一权重和第二权重,针对所述副本的每个叶子节点,计算对应的新叶子节点输出值和对应的旧叶子节点输出值的加权和,并将该叶子节点的输出值更新为所述加权和,得到新的副本树模型;
将所述新的副本树模型部署到线上,所述新的副本树模型用于在预设情况下替换所述预设树模型。
可选地,所述根据所述新训练样本集合更新所述副本的叶子节点输出值,包括:
将所述新训练样本集合输入所述副本,确定所述副本中每个叶子节点被划分到的新训练样本;
根据每个叶子节点被划分到的新训练样本标签值,更新该叶子节点的输出值。
可选地,所述保持所述副本结构不变,包括:保持所述副本中每个树结构节点划分的条件和阈值不变。
可选地,所述根据对所述新训练样本集合的关注程度,确定所述新叶子节点输出值的第一权重和所述旧叶子节点输出值的第二权重,包括:
确定用于训练所述预设树模型的旧训练样本集合中的样本数量;
确定所述旧训练样本集合与所述新训练样本集合之间的样本数量和;
将所述旧训练样本集合中的样本数量,与所述样本数量和的比值确定为所述旧叶子节点输出值的第二权重;
将所述新训练样本集合中的样本数量,与所述样本数量和的比值确定为所述新叶子节点输出值的第一权重。
可选地,所述第一权重和所述第二权重的和为固定值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111397100.9/2.html,转载请声明来源钻瓜专利网。