[发明专利]一种基于改进分类组合的个人信贷信用风险预测方法在审

专利信息
申请号: 202110359366.8 申请日: 2021-04-02
公开(公告)号: CN113034268A 公开(公告)日: 2021-06-25
发明(设计)人: 吴东鹏;杨沛衡;徐典 申请(专利权)人: 河海大学
主分类号: G06Q40/02 分类号: G06Q40/02;G06K9/62
代理公司: 南京千语知识产权代理事务所(普通合伙) 32394 代理人: 尚于杰;祁文彦
地址: 210000 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 改进 分类 组合 个人 信贷 信用风险 预测 方法
【说明书】:

发明公开了一种基于改进分类组合的个人信贷信用风险预测方法,包括确定数据集、将数据均衡化处理、进行组合分类、进行违约率预测等步骤。本发明能保证训练集正负样本比例均衡的同时,还能解决少数样本重复使用的问题,亦使得测试集数据分布及正负样本比例均与原数据集保持一致。得到各份训练集后,将各个分类器用于1份训练集而不是所有训练集进行训练,以防止模型过拟合,最后各个机器学习模型通过加权投票的方式提高准确性和稳定性。本发明方法在LendingClub第一季度到第四季度的数据中进行实验,结果表明,本模型能够在消除了数据样本不均衡的影响下得到较好的违约率预测效果,相较于其他机器学习模型,本模型在各项指标上表现均为最优。

技术领域

本发明属于个人信贷风险预测技术领域,具体涉及一种基于改进分类组合的个人信贷信用风险预测方法。

背景技术

众多企业和银行或依靠自身实力研发智能风控平台,或与金融科技公司及征信机构广泛开展业务合作,将以大数据机器学习为核心的信贷风控方案深度嵌入信用风险控制流程之中。

目前学术界对个人信贷信用风险预测方法进行了一定的研究与探索,常用的方法有平衡计分卡法、专家评分法、模型无关类倾向评分归因法、单一机器学习算法及机器学习集成算法。文献[胡忠义,王超群,陈远,吴江,鲍玉昆.基于多分类器动态集成的P2P违约风险评估[J].管理学报,2019,16(06):915-922.]中对样本进行K均值聚类后以不同的基分类器处理不同区域样本,从而构建出多分类器动态集成模型,但是这种方法会导致最后训练出来的分类器只能很好的拟合同一簇内的数据,集成投票时各个分类器会相互影响,难以保证在其他数据分布下仍有较好的效果。

文献[王重仁,韩冬梅.基于超参数优化和集成学习的互联网信贷个人信用评估[J].统计与决策,2019,35(01):87-91.]中对机器学习算法指导决策树构建的传统教学式方法进行改进,在生成伪数据集过程中结合weight-SMOTE算法改变决策树的学习偏好,但该种方法难以避免原本不存在的新增样本对数据集内在分布的影响。

文献[徐桂琼,李微.基于组合分类的P2P贷款逾期风险预警研究[J].管理现代化,2019,39(04):9-12.]重视金融样本高度不均衡造成的少数样本错误分类风险,运用TwoStep聚类思想对样本进行均衡化处理,从而构造结构平衡的训练集。但其方法存在一定缺陷,会导致逾期样本在训练集和测试集中有部分重合,进而造成预测模型准确率虚高。

发明内容

本发明以机器学习集成算法进为基础,针对当前机器学习在个人信贷风险控制应用中存在的违约信息数据存在大量数据不均衡,模型拟合的数据分布不一致的问题,提出了一种基于改进分类组合的个人信贷信用风险预测方法,能够保证训练集正负样本比例均衡的同时,也能保证训练集和验证集符合原来数据集的总体分布,本申请所用方法避免了原本不存在的新增样本对数据集内在分布的改变,同时通过集成投票的分类器模型提高预测的稳定性和准确性。

本发明采用如下技术方案:

一种基于改进分类组合的个人信贷信用风险预测方法,包括如下步骤:

步骤1:确定数据集,进行数据处理后,利用基于随机森林的递归特征消除方法确定影响借款状态的预测因子。

步骤2:将数据均衡化处理。

步骤3:进行组合分类,训练各个分类器。

步骤4:进行违约率预测。

所述步骤1主要是数据预处理,消除冗余信息对预测造成的干扰,并且筛选出对违约率预测具有重要程度的预测因子,具体包括:

步骤11:确定数据集。将真实交易的数据经过脱敏处理,将借款人资产状况及现金流、借款期限及相关日期、银行账户、征信查询、信用评级作为数据集内容,其中目标数据标签为“借款状态”;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110359366.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top