[发明专利]一种风险识别方法和系统在审
申请号: | 201811556450.3 | 申请日: | 2018-12-19 |
公开(公告)号: | CN109657978A | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 陈玮;刘德彬;黄远江;严开;陈长沙 | 申请(专利权)人: | 重庆誉存大数据科技有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/06;G06K9/62 |
代理公司: | 重庆智慧之源知识产权代理事务所(普通合伙) 50234 | 代理人: | 孙方 |
地址: | 401121 重庆市渝北*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 空壳 风险识别 准确度 信息数据 样本集 预测 申请 机器学习算法 决策树模型 数据分析 问题类型 预设规则 | ||
1.一种风险识别方法,其特征在于,用于对企业空壳风险进行识别,所述方法包括:
获取企业空壳样本集;
通过至少两个机器学习算法对所述企业空壳样本集进行训练以得到空壳识别模型,其中,所述空壳识别模型中包括至少两个决策树模型;
获取待预测企业的信息数据;
将所述待预测企业的信息数据输入至所述空壳识别模型中,根据识别的问题类型以预设规则通过所述空壳识别模型进行预测。
2.如权利要求1所述的风险识别方法,其特征在于,通过smote算法对所述企业空壳样本集进行过采样。
3.如权利要求2所述的风险识别方法,其特征在于,经过所述过采样的企业空壳样本集包括空壳企业和非空壳企业,其中,所述空壳企业与非空壳企业的数量比为1:2。
4.如权利要求1所述的风险识别方法,其特征在于,所述根据待识别的空壳问题类型以预设规则通过所述空壳识别模型进行预测的步骤,包括:
确定所述待识别的空壳问题类型为分类问题,则根据所述至少两个决策树模型的分类结果进行投票,根据投票结果确定最终分类结果;
确定所述待识别的空壳问题类型为回归问题,则根据所述至少两个决策树模型的预测值的均值确定最终预测结果。
5.如权利要求1所述的风险识别方法,其特征在于,所述通过至少两个机器学习算法对所述企业空壳样本集进行训练以得到空壳识别模型的步骤,包括:
根据bootstraping算法从所述企业空壳样本集中生成至少两个训练集;
所述通过至少两个机器学习算法分别对所述至少两个训练集进行训练以得到空壳识别模型。
6.如权利要求5所述的风险识别方法,其特征在于,所述通过至少两个机器学习算法分别对所述至少两个训练集进行训练以得到空壳识别模型的步骤,包括:
对所述至少两个训练集进行标准化;
通过对标准化后的数据进行清洗和选择分别得到所述至少两个训练集对应的特征数据和标签;
将所述至少两个训练集对应的特征数据和标签分别输入至所述机器学习算法,以得到空壳识别模型。
7.如权利要求6所述的风险识别方法,其特征在于,所述特征数据包括但不限于经营年限、注册资金、所有关联公司数量、所有股东平均经营年限、所有股东平均注册资金、所有对外投资公司平均经营年限、所有对外投资公司平均注册资金、所有对外投资公司平均空壳次数、所有对外投资公司空壳次数总和、所有对外投资公司平均被金融机构起诉次数、所有对外投资公司被金融机构起诉次数总和。
8.如权利要求6所述的风险识别方法,其特征在于,所述将所述至少两个训练集对应的特征数据和标签分别输入至所述机器学习算法,以得到空壳识别模型的步骤,包括:
根据预设的特征选择算法和所述标签确定从所述训练集中确定对应的所述所述机器学习算法所对应的当前最优特征和待分裂特征数据;
根据所述当前最优特征建立对应决策树当前节点,根据所述待分裂特征数据建立以所述当前节点为父节点的分支,直止满足于预设条件停止继续构建决策树以生成空壳风险识别模型。
9.如权利要求8所述的风险识别方法,其特征在于,所述预设的特征选择算法至少包括如下一种:信息增益算法、信息增益比算法和基尼指数算法。
10.一种风险识别系统,其特征在于,用于对企业空壳风险进行识别,所述系统包括:
采集模块,用于获取企业空壳样本集;
建树模块,用于通过至少两个机器学习算法对所述企业空壳样本集进行训练以得到空壳识别模型,其中,所述空壳识别模型中包括至少两个决策树模型;
信息获取模块,用于获取待预测企业的信息数据;
识别模块,用于将所述待预测企业的信息数据输入至所述空壳识别模型中,根据识别的问题类型以预设规则通过所述空壳识别模型进行预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆誉存大数据科技有限公司,未经重庆誉存大数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811556450.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种风险识别方法和系统
- 下一篇:一种驾驶服务评价的方法和装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理