[发明专利]一种基于大数据的企业信用评价指标系统在审
| 申请号: | 202110305380.X | 申请日: | 2021-03-19 |
| 公开(公告)号: | CN113011752A | 公开(公告)日: | 2021-06-22 |
| 发明(设计)人: | 陈瑞勇;孙秀文 | 申请(专利权)人: | 天道金科股份有限公司 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/02 |
| 代理公司: | 杭州信义达专利代理事务所(普通合伙) 33305 | 代理人: | 陈继算 |
| 地址: | 310000 浙江省杭州市下城*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 数据 企业信用 评价 指标 系统 | ||
一种基于大数据的企业信用评价指标系统,属于数据处理技术领域,包括数据获取模块,用于获取企业客群数据信息;数据处理模块,用于对获取的授信企业客群数据信息进行分层采样,获取建模分析样本;数据清洗模块,用于发现并纠正建模分析样本中可识别的数据错误,得到第一数据;特征工程模块,用于对第一数据进行处理,获得第二数据;应用模块,用于接收第二数据,并依据逻辑回归算法,从而验证企业信用评价的模型指标;本发明能够有效预测中小微企业的贷款行为表现,并对违约客群与非违约客群产生明显的区分度,在解决中小微企业首贷准入以及银行首贷获客方面破解了已有方法的阻碍,具有相当的可行性和落地应用价值。
技术领域
本发明属于数据处理技术领域,特别涉及一种基于大数据的企业信用评价指标系统。
背景技术
国内目前主流的中小微企业信用评价模型技术主要采用在原有针对国有企业、大型企业的信用评级体系中加入新的指标变量的途径建立模型,例如舒歆(2015)通过Logistic模型回归分析小微企业违约状况与影响小微企业违约的各个因素之间的因果关系,建立了由偿债能力、盈利能力营运能力、创新能力、成长能力、法人治理、信用情况等七大类反应中小微企业资信状况的指标体系。并且已有技术在数据的选择上受到我国中小微企业数据封锁等限制,主要以资产负债率等传统用于大中企业的评价指标搭建模型,得到的结果难以真实反应中小微企业的生产经营状况与信用水平,在以大数据技术破解中小微企业首贷难问题上实用价值较低。
发明内容
本发明的目的在于提供一种基于大数据的企业信用评价指标系统,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:
一种基于大数据的企业信用评价指标系统,包括数据获取模块,用于获取企业客群数据信息,所述企业客群数据信息包括授信企业客群数据信息和非授信企业客群数据信息;数据处理模块,用于对获取的授信企业客群数据信息进行分层采样,获取建模分析样本;数据清洗模块,用于发现并纠正建模分析样本/非授信企业客群数据信息中可识别的数据错误,得到第一数据/预测数据;特征工程模块,用于对第一数据/预测数据进行处理,获得第二数据/模型指标;应用模块,用于接收第二数据/模型指标,并依据逻辑回归算法,从而验证授信企业客群数据信息的信用评价的特征指标/预测非授信企业客群的信用评分。
进一步地,所述特征工程模块包括特征衍生模块、特征分箱模块和特征筛选模块;其中,特征衍生模块,用于将企业各维度数据通过多项式变换计算、时间窗口统计汇总等方式获取更多表征企业行为的新特征,特征分箱模块,用于对连续特征离散化,特征筛选模块,根据特征重要度、线性相关性等指标来选择更重要且更能反应企业还款能力和还款意愿的特征,提高模型泛化能力的同时降低计算复杂度。
进一步地,所述特征分箱模块通过特征IV值衡量特征在系统中的重要度与贡献度,采用如下公式:
其中,Ball表示所有样本中违约样本总数,Bi表示第i个分箱中的违约样本数,Gall表示所有样本中非违约样本总数,Gi表示第i个分箱中的非违约样本数。
进一步地,所述模型指标为覆盖企业基本信息、资产行为状况、经营收入指标以及社会信用表现四大数据维度中的一种或多种。
进一步地,所述数据清洗模块具体的工作步骤如下:
S1:对数据中的无效值进行处理;
S2:处理数据中的缺失值;通过计算每个字段的缺失率,结合字段的重要性,进行缺失补充;
S3:根据检查数据中变量的合理取值范围和相互关联性,对数据的一致性的检查;
S4:其他缺陷进行修正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天道金科股份有限公司,未经天道金科股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110305380.X/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





