[发明专利]企业授信额度自动评定方法、系统及可读存储介质在审
| 申请号: | 202011009943.2 | 申请日: | 2020-09-23 |
| 公开(公告)号: | CN112348654A | 公开(公告)日: | 2021-02-09 |
| 发明(设计)人: | 李振;张刚;刘昊霖;李千惠;张晨星;周光传 | 申请(专利权)人: | 民生科技有限责任公司 |
| 主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62 |
| 代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 巴晓艳 |
| 地址: | 101300 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 企业 额度 自动 评定 方法 系统 可读 存储 介质 | ||
1.一种企业授信额度自动评定方法,其特征在于,所述评定方法具体包括以下步骤:
S1:对企业用户画像数据进行提取与预处理;
S2:将预处理后的变量数据分为连续型变量和分类变量,分别进行特征选择,根据特征变量与目标变量的相关性强弱,选择相关性强的特征纳入模型的构建与评估;
S4:将满足准入条件企业以平均滚动率为依据评定信用等级,通过企业的历史还款行为特征区分企业特性,并预测未来属性;
S5:对满足准入条件和符合信用等级的企业进入贷中自动审查和自动放款;
S6:完成放款后自动对企业进行贷后跟踪和管理。
2.根据权利要求1所述的企业授信额度自动评定方法,其特征在于,所述S1具体包括:
S11:数据提取,从数据库中提取历史授信的客户信息,包括企业基本信息、授信额度、授信审批时间、分期和还款状态;
S12:整理外部数据,包括财报、工商信息和进出口贸易往来,以企业名称为主键与历史授信的客户信息进行拼接,构建进出口企业完整的数据集;
S13:数据预处理,对数据集中存在不同程度的缺失和异常的字段进行预处理,异常值统一处理为指定字符串,缺失值采用插补法进行填充;
S14:统一不同国别的币制,降低模型的复杂度;
S15:构造衍生特征,包括衍生资产负债率、平均进口额、平均出口额、和平均缴税金额特征,同时以进出口日期做时间切片构建时间相关的衍生特征。
3.根据权利要求2所述的企业授信额度自动评定方法,其特征在于,所述S2具体包括以下步骤:
S21:对分类型变量进行WOE编码,然后通过信息值IV衡量自变量对被解释变量的影响程度,IV≤0.03,相关性较弱;0.03<IV≤0.1,相关性较强;IV>0.1,相关性强,具体公式如下:
IV=(Pyi-Pni)*WOEi
其中,yi为第i组样本中的坏样本数,ys为全部坏样本数,ni为第i组样本中的好样本数,ns为全部好样本数;Pyi为第i组样本中的坏样本占全部坏样本比例,Pni为第i组样本中的好样本占全部好样本比例;
S22:对连续型变量采用GBDT提升树进行特征选择,以迭代多棵回归树来共同决策,在每次迭代开始之前,计算损失函数在每个训练样本点的一阶导数gi和二阶导数hi;通过贪心策略生成新的决策树,计算每个叶节点对应的预测值;把新生成的决策树ft(x)添加到模型中,回归树分支时穷举每个特征的每一个阈值寻找最好的分割点,用最小化平方误差来衡量分割的效果;对样本i的前t-1棵树的损失函数求一阶偏导记为Gj,对样本i的前t-1棵树的损失函数求二阶偏导记为Hj,具体计算公式为:
其中,∈表示步长或者学习率;λ为预设参数,用于控制决策树的复杂度;为叶子节点j最优分割点的值;
S23:利用方差膨胀因子VIF分析特征之间的多重共线性:若VIF5,则说明变量间存在较严重的多重共线性,需进行剔除,以保证模型的可解释性,VIF定义为:
其中,Ri为自变量对其余自变量作回归分析的负相关系数,方差膨胀系数VIF越大,说明自变量之间存在共线性的可能性越大;
S24:确定准入负面清单。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于民生科技有限责任公司,未经民生科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011009943.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种精密铸造3D打印机
- 下一篇:一种多氯醚醇自生酸剂及其使用方法





