[发明专利]基于第三方数据源的违约概率分析方法在审
申请号: | 202111271307.1 | 申请日: | 2021-10-29 |
公开(公告)号: | CN113888321A | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 刘琼 | 申请(专利权)人: | 重庆富民银行股份有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q10/04 |
代理公司: | 重庆强大凯创专利代理事务所(普通合伙) 50217 | 代理人: | 张雪萍 |
地址: | 401121 重庆市渝*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 第三 数据源 违约 概率 分析 方法 | ||
本发明涉及数据处理的技术领域,具体为一种基于第三方数据源的违约概率分析方法,包括以下内容:获取多方数据源厂商反馈的原始数据,原始数据包括多个数据维度;对原始数据进行预处理获得变量数据;将变量数据划分为验证集、训练集和测试集;根据最优分箱计算训练集中训练数据各数据维度的IV值和相关系数,根据IV值和相关系数筛选数据维度;根据筛选出的数据维度对应的训练数据生成WOE矩阵,将WOE矩阵作为输入变量,数据维度包括是否逾期,将是否逾期作为输入变量对应的输出结果,根据输入变量和输出结果构建逻辑回归模型。采用本方案,能够解决现有技术中依赖人行征信报告进行违约预测,且预测违约概率准确度较低的技术问题。
技术领域
本发明涉及数据处理的技术领域,具体为一种基于第三方数据源的违约概率分析方法。
背景技术
在贷款过程中,对信贷主体进行风控分析是重要的环节,通过风控分析合理授予信贷主体不同的授信额度,保证信贷机构的自身利益。传统信贷风控包括群组信贷风控和个体信贷风控,群组信贷风控是指采用联保风控的模式,通过组内压力督促信贷主体按时还款,个体信贷风控是指抵押担保贷款、信用评分贷款等。
上述传统信贷风控依赖于资产评估、人行征信报告,尤其人行征信报告在信贷风控中占据重要地位。而当前,人们的征信意识仍比较淡薄,存在很多没有开立过信用卡或任何贷款账户的人行白户,使得依赖人行征信报告的信贷风控无法准确预测信贷主体的违约概率,从而使得信贷主体无法得到期望的授信额度,同时也使得信贷机构丧失价值客户,降低产品利润。因此亟需一种能够无需人行征信报告仍能精准预测违约概率的违约概率分析方法。
发明内容
本发明意在提供一种基于第三方数据源的违约概率分析方法,以解决现有技术中依赖人行征信报告进行违约预测,且预测违约概率准确度较低的技术问题。
本发明提供如下基础方案:
基于第三方数据源的违约概率分析方法,包括以下内容:
获取多方数据源厂商反馈的原始数据,原始数据包括多个数据维度;
对原始数据进行预处理获得变量数据;
将变量数据划分为验证集、训练集和测试集;
根据最优分箱计算训练集中训练数据各数据维度的IV值和相关系数,根据IV值和相关系数筛选数据维度;
根据筛选出的数据维度对应的训练数据生成WOE矩阵,将WOE矩阵作为输入变量,数据维度包括是否逾期,将是否逾期作为输入变量对应的输出结果,根据输入变量和输出结果构建逻辑回归模型。
基础方案的有益效果:
本方案中,使用的原始数据包括多个数据维度,例如职业、年龄、收入负债信息等。通过预处理,剔除容易产生噪声的数据,以及对存在缺省值的数据进行填充,保证数据的完整度。划分验证集、训练集和测试集,在不同阶段使用不同数据,从而判断预测的准确性。根据IV值和相关系数筛选对应的数据维度,从而筛选对违约概率影响最显著的指标。根据筛选出的指标构建逻辑回归模型,通过逻辑回归模型实现违约概率的测算。
本方案,通过多个维度的数据,在预测违约概率时,不受人行征信报告的约束,能够对白户进行违约概率测算,提高预测违约概率的准确性。同时通过剔除噪声变量,筛选影响显著的变量构建逻辑回归模型,进一步提高预测违约概率的准确性。
进一步,获取多方数据源厂商反馈的原始数据,具体包括以下内容:
获取数据ID和数据要求;
根据数据ID和数据要求获取原始数据;
根据数据ID对齐原始数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆富民银行股份有限公司,未经重庆富民银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111271307.1/2.html,转载请声明来源钻瓜专利网。