[发明专利]模型训练方法、风险预测方法及装置在审
申请号: | 202110085351.7 | 申请日: | 2021-01-22 |
公开(公告)号: | CN112767129A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 王雪;黄昶君;陈惊雷;付荣辉;徐少迪;林晨;罗晔;太明珠 | 申请(专利权)人: | 建信金融科技有限责任公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62;G06N20/00 |
代理公司: | 北京市兰台律师事务所 11354 | 代理人: | 李浩;张峰 |
地址: | 200120 上海市浦东新区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 风险 预测 装置 | ||
本申请提供了一种模型训练方法、风险预测方法及装置,应用于金融科技技术领域,本申请基于样本客户的客户数据的重合性确定多个样本数据集合,然后基于各个样本数据集合分别训练微观风险模型,从而可以充分利用能够获得的各维度数据,克服模型训练过程中存在的分块数据或维度数据缺失问题;此外,本申请提高了数据利用率,尽可能用客户所能得到的所有数据对客户的违约风险进行评估,能够提高了评估的准确性。
技术领域
本申请涉及金融科技技术领域,具体而言,本申请涉及一种模型训练方法、风险预测方法及装置。
背景技术
在新金融形态下,互联网和大数据推动了消费结构升级,催生了科技创新和金融创新,推动了信贷产品的创新力度,完善了金融产品体系,线上产品与线下业务均取得了快速发展,但同时也催生出了新的信用管理问题。
一方面,银行不同场景或者细分产品往往提供了不同维度的企业或个人信息,但不同数据的来源与特定场景适用的地区、客群和时期息息相关,导致构建风险模型时常常面临着数据缺失的问题。第二方面,传统金融机构的做法往往是针对不同细分产品单独开发风险评估模型,或是剔除低覆盖度特征搭建统一的风险评价模型。
然而,前者的问题在于对于业务量较少的产品,训练样本数量较低,基于数据驱动构建的模型稳定性不佳;而后者对多个业务场景构建的统一的传统评分卡模型则需要入模特征能够覆盖大部分客群,无法充分有效利用不同业务场景特有的客户数据。
发明内容
本申请提供了一种模型训练方法、风险预测方法及装置,用于充分利用客户数据,提升数据的利用率以及提升风险预测的准确性。本申请采用的技术方案如下:
第一方面,提供了一种模型训练方法,包括:
获取多个样本客户的客户数据与违约信息,不同样本客户的客户数据维度不完全相同;
基于所述样本客户的客户数据的重合性确定多个样本数据集合;
基于各个所述样本数据集合分别训练微观风险模型,得到多个微观风险模型。
可选地,所述基于所述样本客户的客户数据的重合性确定多个样本数据集合,包括:
基于所有样本客户的客户数据确定客户数据包含的数据的维度;
基于任意至少两个数据维度确定一个样本数据集合。
可选地,基于任意至少两个数据维度确定一个样本数据集合,包括:
遍历所述样本客户的客户数据;
当所述样本客户的客户数据包含所述至少两个数据维度的数据时,将所述样本客户的客户数据及对应的违约信息,添加至该至少两个数据维度对应的样本数据集合。
可选地,所述基于各个所述样本数据集合分别训练微观风险模型,得到多个微观风险模型,之前包括:
判断各个所述样本数据集合中的客户数据是否满足预定的数量阈值条件;
如果某一样本数据集合满足预定的数量阈值条件,则基于所述某一样本数据集合中的样本数据训练微观风险模型。
可选地,该方法还包括:
基于所述多个样本客户的客户数据与违约信息,训练确定各个微观风险模型的权重。
第二方面,提供了一种风险预测方法,包括:
获取目标客户的客户数据;
基于所述目标客户的客户数据从根据第一方面训练的多个微观风险模型中确定与所述目标客户匹配的至少一个目标微观风险模型;
基于确定的至少一个目标微观风险模型与所述目标客户的客户数据确定所述目标客户的目标微观违约风险。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于建信金融科技有限责任公司,未经建信金融科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110085351.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种中药煎药机
- 下一篇:一种熟鹌鹑蛋去壳的设备