[发明专利]一种车贷风控模型生成方法、装置及评分卡生成方法在审
申请号: | 202110647121.5 | 申请日: | 2021-06-10 |
公开(公告)号: | CN113554504A | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 周波;徐栋;郭能;蔡浴泓;余勇辉 | 申请(专利权)人: | 浙江惠瀜网络科技有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q10/06 |
代理公司: | 北京正理专利代理有限公司 11257 | 代理人: | 张帆 |
地址: | 311200 浙江省杭州市萧山区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 车贷风控 模型 生成 方法 装置 评分 | ||
1.一种车贷风控模型生成方法,其特征在于,包括:
S10、获取原始车贷用户的基础数据;
S20、对所述基础数据进行特征工程处理;
S30、基于所述特征工程处理后的数据采用逻辑斯蒂回归模型进行训练,直至所述逻辑斯蒂回归模型的KS值达到第一预设阈值,AUC值达到第二预设阈值,得到LR评分卡模型,将所述LR评分卡模型作为车贷风控模型。
2.根据权利要求1所述的方法,其特征在于,所述S20包括:
S200、对所述基础数据进行特征构建,得到多个特征自变量;
S202、对所述多个特征自变量进行分箱处理,得到分箱结果;
S204、对所述分箱结果进行WOE编码,得到编码结果。
3.根据权利要求2所述的方法,其特征在于,所述S20还包括:
S206、计算所述编码结果中每一列特征自变量的IV值;
S208、基于IV值对编码结果进行自变量筛选,保留IV值大于等于第三预设阈值的特征自变量,得到第一筛选结果;
S210、计算所述第一筛选结果中的特征自变量的特征相关系数,保留特征相关系数的绝对值超过第四预设阈值的特征自变量中IV值高的特征自变量,得到第二筛选结果。
4.根据权利要求3所述的方法,其特征在于,将所述第二筛选结果划分为训练集、测试集以及时间外样本集。
5.根据权利要求4所述的方法,其特征在于,所述S30包括:
S300、利用所述训练集对逻辑斯蒂回归模型进行训练,其中,检验所述训练集中的特征自变量的特征相关系数是否为负数,若是,删除该特征自变量,采用网格搜索方法对逻辑斯蒂回归模型的超参数进行调优;
S302、利用所述测试集和时间外样本集对S300训练后的逻辑斯蒂回归模型进行评估和优化,其中,计算所述测试集和时间外样本集的违约概率预测值,根据所述违约概率预测值获取逻辑斯蒂回归模型的KS值和AUC值,判断所述KS值是否达到所述第一预设阈值并且所述AUC值是否达到所述第二预设阈值,若否,执行S206~S210,对逻辑斯蒂回归模型重新进行训练,直至所述KS值和AUC值达到预设阈值。
6.根据权利要求2所述的方法,其特征在于,当某一特征自变量的缺失比例高于第五预设阈值时,判断该特征自变量是否有特殊含义,若是,采用插值法对该特征自变量的缺失内容进行填充;若否,删除该特征自变量。
7.根据权利要求1所述的方法,其特征在于,所述基础数据包括个人基本信息、车辆数据、第三方评分数据。
8.根据权利要求1所述的方法,其特征在于,所述原始车贷用户为初始通过贷款申请并有贷后表现的用户,包括好样本用户和坏样本用户,其中,在预设表现期内没有发生过逾期的用户为好样本用户;在预设表现期内最大逾期天数超过第六预设阈值或逾期次数超过第七预设阈值的用户为坏样本用户。
9.根据权利要求8所述的方法,其特征在于,判断所述好样本用户与所述坏样本用户的比例是否达到第八预设阈值,若否,通过SMOTE算法生成坏样本用户,直至好样本用户与坏样本用户的比例达到所述第八预设阈值。
10.根据权利要求3所述的方法,其特征在于,还包括:
利用所述LR评分卡模型对多个拒绝样本进行预测,得到多个与拒绝样本对应的违约概率预测值;
将多个违约概率预测值进行单调排序,选取违约概率预测值超过第九预设阈值的拒绝样本为新增坏样本用户;
将所述新增坏样本用户加入原始车贷用户中对所述LR评分卡模型进行优化,直至所述LR评分卡模型的KS值收敛,得到最终车贷风控模型。
11.根据权利要求10所述的方法,其特征在于,所述拒绝样本为初始未通过贷款申请的无贷后表现的的用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江惠瀜网络科技有限公司,未经浙江惠瀜网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110647121.5/1.html,转载请声明来源钻瓜专利网。