[发明专利]一种融合机器学习的信贷预测逾期方法及系统在审
| 申请号: | 201910814229.1 | 申请日: | 2019-08-30 |
| 公开(公告)号: | CN110675243A | 公开(公告)日: | 2020-01-10 |
| 发明(设计)人: | 邱晓慧;杨波;于鸽;董晶;王海涛 | 申请(专利权)人: | 北京银联金卡科技有限公司 |
| 主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 11100 北京北新智诚知识产权代理有限公司 | 代理人: | 满靖 |
| 地址: | 100041 北京市石*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 信贷 因素数据 训练样本 预测模型 最佳模型 冗余 排序 预测 预处理 预处理结果 时序 分类处理 机器学习 平衡数据 训练数据 因素选择 最优参数 最优模型 过采样 全面性 重要度 构建 合理性 剔除 删除 融合 | ||
本发明提供融合机器学习的信贷逾期预测方法及系统,收集若干信贷因素数据并进行预处理,对预处理结果中信贷因素数据的重要度进行计算排序并删除冗余,得到选择后信贷因素数据。基于信贷因素数据构建训练样本,基于训练样本利用LSTM建立并训练信贷逾期预测模型,确定最优参数,得到最佳模型后进行信贷逾期预测。本发明广泛收集信贷因素数据提升信贷逾期预测的全面性;对训练数据的缺失采用分类处理提升数据质量;针对用户的类不平衡情况用过采样方法进行处理,平衡数据分布;对影响信贷逾期的全部因素进行排序并剔除冗余,提高因素选择的合理性;基于双向LSTM结合时序因素综合建立信贷逾期预测模型,通过S折交叉确定最优模型参数,提高最佳模型质量。
技术领域
本发明涉及一种融合机器学习的信贷逾期预测方法及系统。
背景技术
近年来随着信贷申请的便捷快速、用户消费习惯的日渐改变,信贷量 不断增长,信贷的业务风险也在不断增加。截至2018年一季度末,信用 卡授信总额为13.14万亿元,保持着快速增长的态势;信用卡逾期半年 未偿信贷总额占期末应偿信贷总额的1.21%,坏账率相对较高。信贷是商 业银行利润的重要组成部分,但目前面临较高风险,因此商业银行需在风 险防控领域重视此问题。
当用户提出信贷申请时,对用户进行信贷逾期预测可有效降低借贷后 发生逾期甚至形成坏账的风险。但是信贷业务涉及申贷人、放贷机构、特 约商户甚至政府宏观金融政策,任何主体变动皆会对信贷风险产生影响, 其跨行业、跨市场的特点使预测的复杂性大大增加。用户信贷逾期预测具 有复杂的时空变异性,受多尺度、随机性等因素影响。传统上,相关机构 根据以往用户信用状况统计分析用户信用评估准则,基于评估准则进行信贷逾期风险预测如5C分析法,从品格、资本、偿付能力、抵押品和经济 周期五个因素对借款人进行判断和权衡。此方法不仅对分析者要求和依赖 性高,还需要培训后备专家,成本较高,而且此多依赖于申贷人的历史表 现和专家主观判断,缺乏客观评价分析,准确性较差。
近期研究者将机器学习应用于信贷逾期预测领域,基于历史消费数据、 人口统计数据、消费数据,采用逻辑回归方法(LR)预测申贷人信用状况; 在信用评分问题中,对传统的统计和现代数据挖掘、机器学习工具进行评 估,结果表明现代机器学习方法优势明显;有研究者提出了一个总体框架, 通过使用机器学习方法评估个人消费信贷风险,其证明回归优化射频性能 在短期分期付款的测试数据上优于逻辑回归模型、近邻算法;但上述方法获得的数据存在局限性,忽略了用户财务信息、其他金融机构信用记录等 数据。另一方面,原始数据一般存在较严重缺失、重复、不规范状况,直 接建模会对预测精度产生较大影响,已有研究没进行充分的数据清洗与特 征选择。此外,不同因素对信贷逾期影响差异较大,当因素较多时,仅依 靠经验、已有研究对因素进行选择,不但效率低而且合理性差。综上所述, 如何能够提供一种能够综合考虑影响信贷逾期的各种因素,并有效的进行 数据预处理及因素选择,从而提供信贷逾期预测准确率成为亟待解决的问 题。
发明内容
本发明提供一种融合机器学习的信贷逾期预测方法及系统,用以解决现 有技术中由于原始数据缺失、数据分布不均衡、多依赖人工经验等,导致信 贷逾期预测效率低而且预测结果不准确的问题。
为了实现上述目的,本发明技术方案提供了一种融合机器学习的信贷逾期 预测方法,所述方法包括:判断信贷因素数据的数据状态并进行数据处理, 得到预处理结果。采用梯度提升树方法计算所述预处理结果中的各信贷因素 数据的重要度并排序,基于排序结果删除冗余因素,得到选择后信贷因素数 据。基于时间序列构建训练样本后,利用LSTM建立并训练信贷逾期预测模型, 并通过S折交叉验证确定所述信贷逾期预测模型的最优参数,得到最佳模型。 通过所述最佳模型对申贷用户进行信贷逾期预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京银联金卡科技有限公司,未经北京银联金卡科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910814229.1/2.html,转载请声明来源钻瓜专利网。





