[发明专利]一种融合机器学习的信贷预测逾期方法及系统在审
| 申请号: | 201910814229.1 | 申请日: | 2019-08-30 |
| 公开(公告)号: | CN110675243A | 公开(公告)日: | 2020-01-10 |
| 发明(设计)人: | 邱晓慧;杨波;于鸽;董晶;王海涛 | 申请(专利权)人: | 北京银联金卡科技有限公司 |
| 主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 11100 北京北新智诚知识产权代理有限公司 | 代理人: | 满靖 |
| 地址: | 100041 北京市石*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 信贷 因素数据 训练样本 预测模型 最佳模型 冗余 排序 预测 预处理 预处理结果 时序 分类处理 机器学习 平衡数据 训练数据 因素选择 最优参数 最优模型 过采样 全面性 重要度 构建 合理性 剔除 删除 融合 | ||
1.一种融合机器学习的信贷逾期预测方法,其特征在于,所述方法包括:
判断信贷因素数据的数据状态并进行数据处理,得到预处理结果;
采用梯度提升树方法对所述预处理结果中的各信贷因素数据的重要度进行计算排序后删除冗余因素,得到选择后信贷因素数据;
基于时间序列对所述信贷因素数据构建训练样本后,基于训练样本利用LSTM建立并训练信贷逾期预测模型,通过S折交叉验证确定所述信贷逾期预测模型的最优参数,得到最佳模型;
通过所述最佳模型进行信贷逾期预测。
2.根据权利要求1所述的融合机器学习的信贷逾期预测方法,其特征在于,还包括:收集若干用户的若干所述信贷因素数据包括,申请信息数据、信用记录数据、贷款状态数据、申请记录数据、信用卡数据作为收集样本;
根据所述信贷因素数据计算所述收集样本中逾期用户和未逾期用户之比,若计算结果为逾期用户少于未逾期用户的类不平衡情况,则对所述逾期用户过采样,使得所述逾期用户和所述未逾期用户之比满足预设比例阈值;
其中,所述信贷因素数据不少于150维。
3.根据权利要求2所述的融合机器学习的信贷逾期预测方法,其特征在于,所述判断信贷因素数据的数据状态并进行数据处理,得到预处理结果,包括:
判断所述信贷因素数据中的数据缺失状态,若大于缺失阈值则采用随机森林算法填补缺失数据;若小于缺失阈值则采用均值法对缺失数据进行填补。
4.根据权利要求3所述的融合机器学习的信贷逾期预测方法,其特征在于,所述采用随机森林算法填补缺失数据,包括:
统计所述信贷因素数据中的每个因素数据缺失情况,得到此因素的完整数据集和因素缺失数据集;
以完整数据集作为训练样本构建随机森林模型,将缺失数据集输入所述随机森林模型用于填补该因素的缺失数据,具体的,
训练样本为(xi1,xi2,xi3...xij-1,xij+1...xin,xij),其中xij为预测目标;xi1,xi2,xi3...xin为特征向量,建立随机森林模型,通过所述随机森林模型预测缺失数据;
其中,采用one-hot编码对离散非数值型因素进行处理。
5.根据权利要求3所述的融合机器学习的信贷逾期预测方法,其特征在于,采用均值法对缺失数据进行填补,包括:
统计所述信贷因素数据中的每个因素数据缺失情况,将缺失因素分为数值属性和非数值属性,若所述缺失因素为数值型则计算所有对象的平均值进行填充,若所述缺失因素为离散非数值型则利用所有对象取值次数最多的值进行填充;
其中,采用one-hot编码对离散非数值型因素进行处理。
6.根据权利要求2所述的融合机器学习的信贷逾期预测方法,其特征在于,采用梯度提升树方法对所述预处理结果中的各因素的重要度进行计算排序后删除冗余因素,得到选择后信贷因素数据,包括:
计算用于判别用户信贷逾期的信贷因素数据在单棵决策树中重要度;
根据单棵决策树中重要度计算结果,计算每个所述信贷因素数据在全部梯度提升树的全局重要度;
依据每个所述信贷因素数据的全局重要度计算结果,对全部所述信贷因素数据依据全局重要度进行排序,将部分冗余信贷因素数据进行删除,得到所述选择后信贷因素数据。
7.根据权利要求2所述的融合机器学习的信贷逾期预测方法,其特征在于,所述基于时间序列对所述信贷因素数据构建训练样本后,基于训练样本利用LSTM建立并训练信贷逾期预测模型,包括:
将用户在周期内各时刻的信贷因素数据和此用户信贷逾期与否状态作为所述训练样本;
对所述选择后信贷因素数据进行归一化处理后输入1-D全卷积层并获取卷积层输出结果;
将所述全卷积层输出结果输入双向LSTM模型,从而构建所述信贷逾期预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京银联金卡科技有限公司,未经北京银联金卡科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910814229.1/1.html,转载请声明来源钻瓜专利网。





