[发明专利]一种信贷风险预测方法、装置、设备及存储介质在审
申请号: | 202110593403.1 | 申请日: | 2021-05-28 |
公开(公告)号: | CN113177844A | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 程序;吕文勇;周智杰;任晓东 | 申请(专利权)人: | 成都新希望金融信息有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q10/06;G06N20/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 薛娇 |
地址: | 610000 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信贷风险 预测 方法 装置 设备 存储 介质 | ||
本发明公开了一种信贷风险预测方法、装置、设备及存储介质,该方法包括:获取历史上多个用户的操作行为数据,所述操作行为数据为用户及为用户提供信贷服务的应用程序之间的交互信息;按照预设处理逻辑对获取的所述操作行为数据进行处理,以使得所述操作行为数据成为可用于模型训练的数据;将处理后的所述操作行为数据加入至样本集中,并利用所述样本集训练预设的机器学习算法,得到风险预测模型,以使用所述风险预测模型基于任意用户的操作行为数据进行相应的风险预测。本申请有效利用了用户在应用程序上操作行为维度的数据,从数据维度的角度有效保证了风险预测模型的模型性能,进而保证风险信贷预测的较高准确性。
技术领域
本发明涉及数据处理技术领域,更具体地说,涉及一种信贷风险预测方法、装置、设备及存储介质。
背景技术
为了策略性地管理信贷风险,金融机构根据用户违约的估计概率为每个用户分配一个信用评分,该信用评分即表示针对用户预测的信贷风险,但是现有技术中这种实现信贷风险预测的方案存在很多问题,最显著的问题则为实现信贷风险预测的准确性较低。
发明内容
本发明的目的是提供一种信贷风险预测方法、装置、设备及存储介质,以改善现有技术中存在的实现信贷风险预测的准确性较低的问题。
为了实现上述目的,本发明提供如下技术方案:
一种信贷风险预测方法,包括:
获取历史上多个用户的操作行为数据,所述操作行为数据为用户及为用户提供信贷服务的应用程序之间的交互信息;
按照预设处理逻辑对获取的所述操作行为数据进行处理,以使得所述操作行为数据成为可用于模型训练的数据;
将处理后的所述操作行为数据加入至样本集中,并利用所述样本集训练预设的机器学习算法,得到风险预测模型,以使用所述风险预测模型基于任意用户的操作行为数据进行相应的风险预测。
在上述实现方式中,本申请获取多个用户中每个用户及为用户提供信贷服务的应用程序的之间的交互信息为操作行为数据,基于操作行为数据训练机器学习算法得到相应风险预测模型,以利用该风险预测模型基于任意用户的操作行为数据进行相应的风险预测,从而有效利用了用户在应用程序上操作行为维度的数据,从数据维度的角度有效保证了风险预测模型的模型性能,进而保证风险信贷预测的较高准确性。
可选地,按照预设处理逻辑对获取的所述操作行为数据进行处理之前,还包括:
基于获取的所述操作行为数据衍生获得多维度的衍生特征数据;
将所述衍生特征数据及所述操作行为数据进行合并,并将所述操作行为数据更新为合并所得的数据。
在上述实现方式中,对客户操作层面的数据进行了更有效的利用和信息挖掘,在模型训练时能够实现对操作行为相应数据更成分的学习,进而保证训练所得的风险预测模型能够达到较高的准确性。
可选地,按照预设处理逻辑对获取的所述操作行为数据进行处理,包括:
针对所述操作行为数据包含的每项特征,获取每项所述特征对应特征值的分布情况及每项所述特征对应特征值的缺失率;
如果任意特征对应特征值的分布情况异常和/或缺失率达到缺失率阈值,则剔除该任意特征。
在上述实现方式中,本申请通过剔除特征值分布情况异常及缺失率很高的特征,能够剔除无法充分表现用户的操作行为的数据,保证基于操作行为数据实现模型训练时的有效性,进而保证模型的稳定性和科技实行。
可选地,按照预设处理逻辑对获取的所述操作行为数据进行处理,包括:
分析所述操作行为数据包含的不同特征之间是否存在多重共线性;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都新希望金融信息有限公司,未经成都新希望金融信息有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110593403.1/2.html,转载请声明来源钻瓜专利网。