[发明专利]基于CatBoost与受限玻尔兹曼机结合的用户借贷违约预测方法在审
申请号: | 202110024644.4 | 申请日: | 2021-01-08 |
公开(公告)号: | CN112700324A | 公开(公告)日: | 2021-04-23 |
发明(设计)人: | 张涛;张冰 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06N20/20;G06N3/04;G06N3/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 catboost 受限 玻尔兹曼机 结合 用户 借贷 违约 预测 方法 | ||
本发明公开了基于CatBoost与受限玻尔兹曼机结合的用户借贷违约预测方法,目标变量定义,选取建模的客户数据,对所述金融机构自身的字段和所述第三方数据字段进行分类;数据预处理,处理不平衡的数据,利用测试集通过使用准确率、查准率、召回率、f1‑度量和AUC值这5个评价指标上对所训练的模型进行评估,基于建立的模型,对贷款用户进行违约预测。本方法根据已有贷款客户的基本信息数据、征信数据、行为数据等,预测一个新的借款人的违约概率,起到提前预警的作用,预估未来的坏账比例,及时做好资金安对违约概率可能性较高的客户给与更多的关注,以避免损失,减少监控与监测过程中的人工参与部分,利用自动化的方法提高放款审核的准确率和效率。
技术领域
本发明涉及互联网金融风控技术领域,尤其是涉及一种基于CatBoost与受限玻尔兹曼机结合的用户借贷违约预测方法。
背景技术
近年来,金融行业的借贷业务在中国发展十分迅速,然而法律层面的监管相对较弱,有一定的监管盲区。借贷行业的门槛较低,参与人群的质量有很大差异,因此,金融行业的借贷业务的风险水平较高。对于以信贷类服务为主要业务的互联网金融借贷平台,由于信息技术不完善,平台无法有效把控资产端风险,借贷用户违约现象不断,用户为了获得企业的贷款,对自己的相关信息可能存在隐瞒、欺骗的风险,这样不对称的用户信息会增加企业的信贷风险,可能会给企业造成一定的损失。通过对借贷用户在网购、交易、社交等平台的信誉及行为数据进行深入挖掘和分析,对将分散在不同场景分散化的局部信息进行加工融合,能够使其成为完整的全局信息。利用以大数据为基础,以机器学习方法为手段建立的违约预测模型,能够将用户的有效信息转化为用户的违约概率,能够很好地解决借贷用户与借贷平台在交易过程中的存在的信息不对称的问题。
目前,金融大数据使用了更多的第三方数据,主要包括多头借贷行为、互联网、网上购物、第三方支付、反欺诈等数据,极大丰富了信用评估的可用数据维度,这使得全方位有效地对用户进行违约预测成为可能,但同时也对预测模型的特征处理性能提出了更高的要求。金融信贷机构特征集合普遍具有数量多、纬度高的特点,但用户违约预测应关注的并不是数据规模本身,而是这些海量数据中有价值的特征,按照传统的方式人工进行特征筛选已不能很好的适用当前的信贷场景,依托先进的机器学习、数据挖掘等技术,金融保险行业的信贷相关的数据无论是在规模还是在数据来源上都有了长足的进步发展。在对用户进行违约预测的过程中,引入机器学习相关模型构造学习策略和模型体系,是对借贷用户进行风险控制较为常见的手段。
最近几年,很多学者针对用户借贷违约提出了许多新的用户借贷违约预测模型,这些模型大体上可以分为两类:第一类是应用层次分析法、模糊综合评价法等统计学方法建立的信用指标评价体系,并指定每个指标的主观权重。第二类是使用线性的数据挖掘算法建立的风险评估模型,这些模型存在一些共性的问题:评估准确率低,究其原因是信用数据存在非线性结构。而可以处理非线性结构数据的二分类算法应用比较广泛的有:支持向量机和BP神经网络。但是金融贷款数据存在类不平衡的特点,例如拍拍贷平台正常还款记录大约是违约记录的10 倍,对于这样的风险数据,支持向量机模型的第一类错误误判率较高,即把正常还款客户判为违约客户。BP神经网络也存在同样的问题,而且BP神经网络模型只有训练集和预测集的误差相近时,模型才具有泛化能力。
因此,有必要设计一种准确率更高的用户借贷违约预测模型。
发明内容
为了解决以上技术问题,本发明中提供了一种基于CatBoost与受限玻尔兹曼机结合的用户借贷违约预测方法,旨在为数据集所对应的借贷平台提供借款用户的违约预测方法,根据已有贷款客户的基本信息数据、征信数据、行为数据等,预测一个新的借款人的违约概率,可以起到提前预警的作用,预估未来的坏账比例,及时做好资金安排,也可以对违约概率可能性较高的客户给与更多的关注,及时发现问题,以避免损失,减少监控与监测过程中的人工参与部分,利用自动化的方法提高放款审核的准确率和效率。
为实现上述目的,本发明的技术方案如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110024644.4/2.html,转载请声明来源钻瓜专利网。