[发明专利]一种基于LightGBM的金融违约概率预测模型在审
| 申请号: | 202010237217.X | 申请日: | 2020-03-30 |
| 公开(公告)号: | CN111311401A | 公开(公告)日: | 2020-06-19 |
| 发明(设计)人: | 江远强 | 申请(专利权)人: | 百维金科(上海)信息科技有限公司 |
| 主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q10/04;G06K9/62 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 200122 上海市崇明区长兴镇潘园公*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 lightgbm 金融 违约 概率 预测 模型 | ||
1.一种基于LightGBM的金融违约概率预测模型,其特征在于,其建模包括以下步骤:
步骤一:样本数据获取,选取建模分析所需的客户样本,获取客户申请信息、征信数据以及客户授权获取的第三方数据,将所述个申请信息、征信数据和第三方数据进行分析并转换后整合在一张宽表中;
步骤二:数据预处理,将步骤一获取的数据进行预处理,包括异常值处理和缺失值处理;
步骤三:特征工程,将预处理后的数据划分为连续型数据和离散型数据,分别对连续型数据和离散型数据进行特征数据提取,并分析找出重要特征,构造出于借贷相关性强的组合特征;
步骤四:划分数据集,将经过特征工程处理后的数据划分为训练集和测试集;
步骤五:模型训练以及调参,使用LightGBM算法,在训练集上进行训练;并反复对模型的可调参数进行调整,直至得到性能最优的模型;
步骤六:模型评估,通过模型评价指标以及与其他算法模型对比,综合评估模型的区分能力、预测能力和稳定性;
步骤七:模型部署及监控,将模型部署到系统平台上,监控模型的评估指标,并根据监控的评估指标及时更新调整模型。
2.根据权利要求1所述的一种基于LightGBM的金融违约概率预测模型,其特征在于,所述异常值处理包括,对数据进行统计性分析后,根据数据的分布并结合数据本身的业务逻辑,剔除异常值或者将异常值作缺失值处理。
3.根据权利要求1所述的一种基于LightGBM的金融违约概率预测模型,其特征在于,所述缺失值处理采用单值插入法或者随机森林算法构造决策树对缺失值预测插补的方法。
4.根据权利要求1所述的一种基于LightGBM的金融违约概率预测模型,其特征在于,所述步骤三中,所述离散型数据在进行特征数据提取之前先进行独热编码。
5.根据权利要求1所述的一种基于LightGBM的金融违约概率预测模型,其特征在于,所述客户授权获取的第三方数据包括网上购物、运营商数据、APP使用行为数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百维金科(上海)信息科技有限公司,未经百维金科(上海)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010237217.X/1.html,转载请声明来源钻瓜专利网。





