[发明专利]基于GBDT算法与逻辑回归模型的企业违约风险评估方法设备及介质在审
申请号: | 202210143343.8 | 申请日: | 2022-02-16 |
公开(公告)号: | CN114519519A | 公开(公告)日: | 2022-05-20 |
发明(设计)人: | 刘先淇;郭英楠;崔乐乐 | 申请(专利权)人: | 天元大数据信用管理有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/02;G06N20/00 |
代理公司: | 北京君慧知识产权代理事务所(普通合伙) 11716 | 代理人: | 肖鹏 |
地址: | 250013 山东省济南市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 gbdt 算法 逻辑 回归 模型 企业 违约 风险 评估 方法 设备 介质 | ||
1.基于GBDT算法与逻辑回归模型的企业违约风险评估方法,其特征在于,所述方法包括:
获取多个样本企业的企业经营数据,其中,所述企业经营数据为第三方主体存储的与样本企业有关的数据,且所述企业经营数据包括以下至少一种:工商管理数据、征信数据、互联网数据;
对各种所述企业经营数据进行处理,得到与每种企业经营数据对应的标准化数据,计算与每种标准化数据对应的WOE值与IV值,并根据所述WOE值对变量进行数值区间的划分,根据所述IV值对变量进行筛选;
将完成数值区间划分与筛选的变量作为输入数据集,采用GBDT算法进行训练,构造出适用于逻辑回归模型的入模变量;
将所述入模变量输入至逻辑回归模型,构建企业违约风险评估模型;
获取待评估企业的企业经营数据,采用所述企业违约风险评估模型对所述待评估企业进行评估,得到待评估企业的违约风险评估结果。
2.如权利要求1所述的基于GBDT算法与逻辑回归模型的企业违约风险评估方法,其特征在于,所述对各种所述企业经营数据进行处理,得到与每种企业经营数据对应的标准化数据,包括:
对所述企业经营数据进行规范化处理得到原始数据,其中,所述规范化处理包括以下至少一项:将所述企业经营数据进行融合对齐,去除所述企业经营数据中的噪声数据和/或冗余数据;
对所述原始数据进行计算处理,将所述原始数据中的字符型数据转化成数值型数据;
对计算处理后的所述原始数据进行标准化处理,消除所述原始数据的量纲,得到标准化数据。
3.如权利要求2所述的基于GBDT算法与逻辑回归模型的企业违约风险评估方法,其特征在于:
采用大数据ETL技术对所述企业经营数据进行规范化处理得到原始数据。
4.如权利要求3所述的基于GBDT算法与逻辑回归模型的企业违约风险评估方法,其特征在于:
采用z-score标准化方法对计算处理后的所述原始数据进行标准化处理,消除所述原始数据的量纲,得到标准化数据。
5.如权利要求1所述的基于GBDT算法与逻辑回归模型的企业违约风险评估方法,其特征在于,所述方法还包括:
根据预定义的违约风险标准对所述多个样本企业进行划分,将所述多个样本企业划分为正常企业与具有违约风险的企业,其中,所述预定义的违约风险标准包括以下至少一项:逾期、企业在金融黑名单中、企业在失信企业名单中、企业欠税、企业经营异常。
6.如权利要求1所述的基于GBDT算法与逻辑回归模型的企业违约风险评估方法,其特征在于,所述方法还包括:
获取样本企业的多种企业经营数据,若所述多种企业经营数据中的一种或几种数据缺失,则获取该种企业经营数据缺失的原因;
根据数据缺失的原因判断该种企业经营数据对构建企业风险评估模型的影响,若该种企业经营数据在多个样本企业中缺失率大于60%,则对该种企业经营数据进行剔除。
7.如权利要求1所述的基于GBDT算法与逻辑回归模型的企业违约风险评估方法,其特征在于,所述方法还包括:
采用ROC曲线对构建的所述企业风险评估模型进行评价;和/或
采用AUC值对构建的所述企业风险评估模型进行评价。
8.如权利要求1所述的基于GBDT算法与逻辑回归模型的企业违约风险评估方法,其特征在于,所述方法还包括:
通过将分值表示为比率对数的线性表达式来定义评分卡的分值刻度,将所述企业违约风险评估模型得到的待评估企业的违约风险评估结果转换成评分卡结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天元大数据信用管理有限公司,未经天元大数据信用管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210143343.8/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理