[发明专利]一种融资平台企业性质分类方法和系统在审
| 申请号: | 202110536252.6 | 申请日: | 2021-05-17 |
| 公开(公告)号: | CN113129133A | 公开(公告)日: | 2021-07-16 |
| 发明(设计)人: | 徐衡锐;黄雪 | 申请(专利权)人: | 无锡航吴科技有限公司 |
| 主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q40/04;G06Q10/04;G06K9/62 |
| 代理公司: | 北京华际知识产权代理有限公司 11676 | 代理人: | 李帅 |
| 地址: | 214000 江苏省无锡市新吴区*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 融资 平台 企业性质 分类 方法 系统 | ||
1.一种融资平台企业性质分类方法,其特征在于,所述分类方法包括以下步骤:
步骤S100:从企业的银行账户信息和交易流水中获取交易卡数、交易次数和交易金额构建分析基表,从分析基表中统计和衍生出P个特征变量,P为自然数;
步骤S200:根据各个特征变量的实际意义选择合适的方法补充缺失值,得到特征变量与企业相对应的数据表,并对这P个特征变量进行标准化处理;
步骤S300:计算各个特征变量的重要度,并从P个特征变量中选取部分样本数据分别构建多棵决策树,选择出M个合适的特征变量作为模型输入特征变量,其中,M为自然数;
步骤S400:构建由多棵决策树构成的随机森林,以信息熵作为特征选择的标准,判别输入特征变量的类型,进而对企业进行分类。
2.根据权利要求1所述的一种融资平台企业性质分类方法,其特征在于:所述步骤S200中的标准化处理包括以下步骤:
步骤S210:计算各个特征变量的平均值其中,t表示企业的数量,i的取值范围为1到P,为第i个特征变量的平均值,xi1表示第一个企业的第i个特征变量的数值;
步骤S220,计算各特征变量标准差,计算公式为:
其中,σi为第i个特征变量的标准差,为开平方,为步骤210所述的各个特征变量平均值;
步骤S230,对各特征变量进行数据标准化处理,其计算公式为:其中,X为各个特征变量的数据,V*为对应的X经过标准化处理得到的数据。
3.根据权利要求1所述的一种融资平台企业性质分类方法,其特征在于:所述步骤S300包括以下步骤:
步骤S310,利用P个特征变量的部分样本数据构建多棵决策树,对每一棵决策树,选择相应的袋外数据OOB计算袋外数据误差,记为errOOB1;
步骤S320,随机对袋外数据OOB所有样本的特征X加入噪声干扰,随机改变样本在特征X处的值,再次计算袋外数据误差errOOB2;
步骤S330,那么特征X的重要性=∑(errOOB2-errOOB1)/N,其中,N为决策树的棵数,将各个特征按照重要性从大到小的顺序排序,选取排序前M所对应的特征变量作为模型输入特征变量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无锡航吴科技有限公司,未经无锡航吴科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110536252.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种融资平台账户分类方法和系统
- 下一篇:一种颜色搭配方法及系统





