[发明专利]一种基于改进分类组合的个人信贷信用风险预测方法在审
申请号: | 202110359366.8 | 申请日: | 2021-04-02 |
公开(公告)号: | CN113034268A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 吴东鹏;杨沛衡;徐典 | 申请(专利权)人: | 河海大学 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62 |
代理公司: | 南京千语知识产权代理事务所(普通合伙) 32394 | 代理人: | 尚于杰;祁文彦 |
地址: | 210000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 分类 组合 个人 信贷 信用风险 预测 方法 | ||
1.一种基于改进分类组合的个人信贷信用风险预测方法,其特征在于,包括如下步骤:
步骤1:确定数据集,进行数据处理后,利用基于随机森林的递归特征消除方法确定影响借款状态的预测因子;
步骤2:将数据集中的数据进行均衡化处理;
步骤3:对经过均衡化处理后的数据进行组合分类,训练各个分类器组成集成投票模型;
步骤4:进行违约率预测;将预测因子数据输入基于改进组合分类的集成投票违约率预测模型中,输出违约率结果。
2.如权利要求1所述的基于改进分类组合的个人信贷信用风险预测方法,其特征在于,所述步骤1包括:
步骤11:确定数据集;将真实交易的数据经过脱敏处理,将借款人资产状况及现金流、借款期限及相关日期、银行账户、征信查询、信用评级作为数据集内容,其中目标数据标签为“借款状态”;
步骤12:将借款状态中的“宽恕期中”、“已偿清”界定为非逾期,记为0;将“逾期16~30天”、“逾期31~120天”、“违约”、“核销”界定为逾期,记为1;
步骤13:剔除缺失值比例在55%以上的特征,随后剔除同值性超过99%的特征、与逾期行为明显无关的特征及离群值过多的特征,最后得到数据样本;
步骤14:针对于fico_score和last_fico_score两个特征,采用信贷违约预测中常见的处理方法,以fico评分的平均水平作为fico评级的代理变量,进行以下处理;
fico score=0.5×fico range low+0.5×fico range high;
last fico score=0.5×last fico range low+0.5×last fico range high;
步骤15:分别计算出各候选预测因子与借款状态的相关系数;
相关系数的计算公式为:
式中,Xi为第i个样本的预测因子值的大小,为预测因子的均值,Yi为第i个样本的实测值大小,为实测值均值,M为样本总数量;
步骤16:将剔除相关性大于0.9的特征直接剔除;
步骤17:采用基于遗传算法的粗糙集约简策略进行特征筛选,得到特征集,最后将上述特征用于基于随机森林的递归式特征消除中再进一步进行特征筛选。
3.如权利要求2所述的基于改进分类组合的个人信贷信用风险预测方法,其特征在于,所述步骤17包括:
步骤171:将粗糙集约简策略筛选完的特征作为初始特征集;
步骤172:采用随机森林算法拟合具有当前特征集的数据,然后计算各个特征的重要性程度,并进行排名;
步骤173:删除k个特征,更新当前特征集;
步骤174:跳转到步骤172,直到特定数量的特征被保留下来,此时特征集包含所有重要性程度较高的特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110359366.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:公路施工用路面喷淋养护设备及其使用方法
- 下一篇:一种电子物证保存用新型U盘