[发明专利]一种风险识别方法和系统在审
申请号: | 201811556450.3 | 申请日: | 2018-12-19 |
公开(公告)号: | CN109657978A | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 陈玮;刘德彬;黄远江;严开;陈长沙 | 申请(专利权)人: | 重庆誉存大数据科技有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q40/06;G06K9/62 |
代理公司: | 重庆智慧之源知识产权代理事务所(普通合伙) 50234 | 代理人: | 孙方 |
地址: | 401121 重庆市渝北*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 空壳 风险识别 准确度 信息数据 样本集 预测 申请 机器学习算法 决策树模型 数据分析 问题类型 预设规则 | ||
本申请提供了一种风险识别方法,用于对企业空壳风险进行识别,所述方法包括:获取企业空壳样本集;通过至少两个机器学习算法对所述企业空壳样本集进行训练以得到空壳识别模型,其中,所述空壳识别模型中包括至少两个决策树模型;获取待预测企业的信息数据;将所述待预测企业的信息数据输入至所述空壳识别模型中,根据识别的问题类型以预设规则通过所述空壳识别模型进行预测。本申请还提供了一种风险识别系统。通过本申请提供的风险识别方法和系统,增加训练的模型的准确度,在判断企业是否为空壳企业时可以更加全面地进行数据分析,以提高数据的判断准确度。
技术领域
本申请属于数据处理技术领域,具体涉及一种风险识别方法和风险识别系统。
背景技术
企业在生产经营过程中,需要通过金融市场的金融工具实现资金的筹备等,而,企业空壳会对金融市场造成严重的损失,金融企业通过建立风险模型并通过风险模型对企业经营风险进行预测,以使得金融企业保持投资回报。
在企业经营过程中,每个企业每天都在发生着改变,这些改变有可能使得企业越来越好,也有可能使得企业面临各种风险。面对企业的千万级数据,从中分析出企业的风险信息对企业运营的决策和投资者都是比较好的参考。目前已有的企业经营风险预测方法主要包括于统计学的方法和基于机器学习的方法。
目前,现有的企业风险预测评估方法不完善,而且在风险模型的建立过程中数据处理量过大,对服务器造成巨大压力,且数据处理速度过慢。因此,亟待一种企业风险识别能够结合企业的各种资产、财务数据、经营数据、债务相关数据,迅速建立模型并将该模型应用到预测数据中,从不同维度对企业风险进行预测。
发明内容
为了解决现有技术存在的上述问题,本申请目的在于提供一种风险识别方法和系统,旨在解决现有预测模型对内存消耗过大,存在大量不必要的数据计算的问题。
为解决上述技术问题,本申请提供了一种风险识别方法,用于对企业空壳风险进行识别,所述方法包括:获取企业空壳样本集;通过至少两个机器学习算法对所述企业空壳样本集进行训练以得到空壳识别模型,其中,所述空壳识别模型中包括至少两个决策树模型;获取待预测企业的信息数据;将所述待预测企业的信息数据输入至所述空壳识别模型中,根据识别的问题类型以预设规则通过所述空壳识别模型进行预测。
可选地,通过smote算法对所述企业空壳样本集进行过采样。
可选地,经过所述过采样的企业空壳样本集包括空壳企业和非空壳企业,其中,所述空壳企业与非空壳企业的数量比为1:2。
可选地,所述根据待识别的空壳问题类型以预设规则通过所述空壳识别模型进行预测的步骤,包括:确定所述待识别的空壳问题类型为分类问题,则根据所述至少两个决策树模型的分类结果进行投票,根据投票结果确定最终分类结果;确定所述待识别的空壳问题类型为回归问题,则根据所述至少两个决策树模型的预测值的均值确定最终预测结果。
可选地,所述通过至少两个机器学习算法对所述企业空壳样本集进行训练以得到空壳识别模型的步骤,包括:根据bootstraping算法从所述企业空壳样本集中生成至少两个训练集;所述通过至少两个机器学习算法分别对所述至少两个训练集进行训练以得到空壳识别模型。
可选地,所述通过至少两个机器学习算法分别对所述至少两个训练集进行训练以得到空壳识别模型的步骤,包括:对所述至少两个训练集进行标准化;通过对标准化后的数据进行清洗和选择分别得到所述至少两个训练集对应的特征数据和标签;将所述至少两个训练集对应的特征数据和标签分别输入至所述机器学习算法,以得到空壳识别模型。
可选地,所述特征数据包括但不限于经营年限、注册资金、所有关联公司数量、所有股东平均经营年限、所有股东平均注册资金、所有对外投资公司平均经营年限、所有对外投资公司平均注册资金、所有对外投资公司平均空壳次数、所有对外投资公司空壳次数总和、所有对外投资公司平均被金融机构起诉次数、所有对外投资公司被金融机构起诉次数总和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆誉存大数据科技有限公司,未经重庆誉存大数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811556450.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种风险识别方法和系统
- 下一篇:一种驾驶服务评价的方法和装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理