[发明专利]基于大数据的信用评估方法、装置、电子设备及存储介质在审
| 申请号: | 201810960866.5 | 申请日: | 2018-08-22 |
| 公开(公告)号: | CN109345368A | 公开(公告)日: | 2019-02-15 |
| 发明(设计)人: | 林荣吉 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
| 主分类号: | G06Q40/02 | 分类号: | G06Q40/02 |
| 代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
| 地址: | 518000 广东省深圳市福田区益田路503*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 信用评估 指标变量 大数据 变量特征 存储介质 电子设备 分箱 初始聚类中心 多个变量 分布特征 聚类运算 模型评估 样本用户 评估 信用 | ||
1.一种信用评估方法,其特征在于,包括:
采用等频法对样本用户的多个指标变量进行划分,获得多个等频区间;
将所述等频区间的端点作为初始聚类中心对所述多个指标变量进行聚类运算,得到各个指标变量的多个变量分箱;
从各个指标变量的所述变量分箱中提取变量特征,基于所述变量特征对信用评估模型进行训练;
通过训练后的所述信用评估模型对待评估用户的信用进行评估。
2.根据权利要求1所述的信用评估方法,其特征在于,从各个指标变量的所述变量分箱中提取变量特征,包括:
对各个指标变量的所述多个变量分箱进行WOE编码;
将所述多个变量分箱的WOE编码作为各个指标变量的变量特征。
3.根据权利要求2所述的信用评估方法,其特征在于,对各个指标变量的所述多个变量分箱进行WOE编码,包括:
通过下式对各个指标变量的所述多个变量分箱进行WOE编码,
其中,Gi为第i个变量分箱下的正常用户数量,Gtotal为指标变量下的正常用户的总数量,Bi为第i个变量分箱下的不良用户数量,Btotal为指标变量下的不良用户的总数量。
4.根据权利要求2所述的信用评估方法,其特征在于,所述信用评估方法还包括:
对各个变量分箱的所述WOE编码进行加权运算得到各个指标变量的信息值;
基于各个指标变量的所述信息值对所述多个指标变量进行筛选。
5.根据权利要求1所述的信用评估方法,其特征在于,采用等频法对样本用户的多个指标变量进行划分,包括:
获取所述样本用户的历史数据中的所述多个指标变量;
确定所述多个指标变量中的连续变量,并对所述连续变量赋予宏;
采用等频法对赋予宏的所述连续变量进行快速分箱。
6.根据权利要求1所述的信用评估方法,其特征在于,所述信用评估方法还包括:
基于宏代码编写各个指标变量的变量分箱以及各个指标变量的变量分箱的WOE编码。
7.根据权利要求1至6中任一项所述的信用评估方法,其特征在于,所述信用评估方法还包括:
统计每个指标变量的多个变量分箱的上下限,得到每个指标变量的分布特征。
8.一种信用评估装置,其特征在于,包括:
划分单元,用于采用等频法对样本用户的多个指标变量进行划分,获得多个等频区间;
聚类单元,用于将所述等频区间的端点作为初始聚类中心对所述多个指标变量进行聚类运算,得到各个指标变量的多个变量分箱;
训练单元,用于从各个指标变量的所述变量分箱中提取变量特征,基于所述变量特征对信用评估模型进行训练;
评估单元,用于通过训练后的所述信用评估模型对待评估用户的信用进行评估。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储器,所述存储器上存储有计算机可读指令,所述计算机可读指令被所述处理器执行时实现如权利要求1至7中任一项所述的信用评估方法。
10.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的信用评估方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810960866.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种实时多任务处理的会计记账系统
- 下一篇:备付金的配置方法及终端设备





