[发明专利]决策模型训练方法、装置、存储介质及电子设备在审
申请号: | 202211349622.6 | 申请日: | 2022-10-31 |
公开(公告)号: | CN115758133A | 公开(公告)日: | 2023-03-07 |
发明(设计)人: | 熊永福;凌永强;赵鹏 | 申请(专利权)人: | 重庆蚂蚁消费金融有限公司 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06N20/00;G06Q10/04;G06Q40/03 |
代理公司: | 北京恒博知识产权代理有限公司 11528 | 代理人: | 范胜祥 |
地址: | 400060 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 决策 模型 训练 方法 装置 存储 介质 电子设备 | ||
1.一种决策模型训练方法,所述方法包括:
将训练数据输入至决策模型中,得到所述训练数据对应的预测收益;
根据所述预测收益同时调整所述决策模型中的多个超参数,以更新所述决策模型;
将所述训练数据输入至更新后的所述决策模型,得到更新后的预测收益,并再次执行所述根据所述预测收益同时调整所述决策模型中的多个超参数的步骤,直至更新后的预测收益满足预设条件时,所述决策模型训练完成。
2.根据权利要求1所述的训练方法,所述根据所述预测收益同时调整所述决策模型中的多个超参数,包括:
根据所述预测收益和所述训练数据对应的历史收益之间的变化趋势,同时调整所述决策模型中的多个超参数。
3.根据权利要求2所述的训练方法,所述将所述训练数据输入至更新后的所述决策模型,得到更新后的预测收益,并再次执行所述根据所述预测收益同时调整所述决策模型中的多个超参数的步骤,包括:
将所述训练数据输入至更新后的所述决策模型,得到更新后的预测收益;
根据更新前的预测收益、更新后的预测收益以及历史收益之间的变化趋势,同时调整所述决策模型中的多个超参数。
4.根据权利要求1所述的训练方法,所述根据所述预测收益同时调整所述决策模型中的多个超参数,包括:
获取训练前的决策模型中的多个超参数对应的分布曲线;
根据所述预测收益,同时调整满足所述分布曲线的多个超参数分别对应的数值。
5.根据权利要求1所述的训练方法,所述根据所述预测收益同时调整所述决策模型中的多个超参数,包括:
获取训练集中多个历史决策模型分别对应的历史分布曲线,其中,每个所述历史决策模型对应的历史分布曲线为所述历史决策模型中的多个超参数对应的分布曲线;
根据所述预测收益为所述决策模型的多个超参数匹配所述多个历史分布曲线中的目标分布曲线;
根据所述目标分布曲线同时调整所述决策模型中的多个超参数。
6.根据权利要求5所述的训练方法,所述根据所述预测收益为所述决策模型的多个超参数匹配所述多个历史分布曲线中的目标分布曲线,包括:
分别获取将所述训练数据输入至每个所述历史决策模型后得到的训练收益;
根据每个所述训练收益和所述预测收益之间的关联关系,为所述决策模型的多个超参数匹配所述多个历史分布曲线中的目标分布曲线。
7.根据权利要求1所述的训练方法,所述根据所述预测收益同时调整所述决策模型中的多个超参数,以更新所述决策模型,包括:
根据预测收益和优化算法,调整所述决策模型中的多个超参数的分布曲线以及所述多个超参数分别对应的数值;其中,所述优化算法至少包括下述的一种或多种:贝叶斯优化算法、随机搜索算法、网格搜索算法和遗传算法。
8.根据权利要求1-7任一项所述的训练方法,所述多个超参数至少包括下述的一种或多种:策略超参数、规则超参数和模型超参数。
9.根据权利要求1-7任一项所述的训练方法,所述决策模型为信贷决策模型,所述预测收益至少包括下述的一种或多种:平均通过率、平均风险率和平均收益率。
10.根据权利要求1-7任一项所述的训练方法,所述决策模型的训练为离线训练;
所述直至更新后的预测收益满足预设条件时,所述决策模型训练完成之后,还包括:
为线上决策模型配置训练完成的所述决策模型对应的多个超参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆蚂蚁消费金融有限公司,未经重庆蚂蚁消费金融有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211349622.6/1.html,转载请声明来源钻瓜专利网。