[发明专利]一种数据处理方法及装置在审
申请号: | 201711484315.8 | 申请日: | 2017-12-29 |
公开(公告)号: | CN108230131A | 公开(公告)日: | 2018-06-29 |
发明(设计)人: | 马宁;段立新;王肃 | 申请(专利权)人: | 国信优易数据有限公司 |
主分类号: | G06Q40/00 | 分类号: | G06Q40/00;G06Q10/04 |
代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 徐彦圣 |
地址: | 100070 北京市丰台*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 企业财务数据 异常监测 历史财务数据 预测 数据处理 自变量 财务数据 监管数据 监管信息 输入完成 因变量 构建 预设 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
基于企业财务数据特征,构建用于预测企业未来是否受罚的异常监测模型;
获取预设企业的与企业财务数据特征对应的历史财务数据,以及是否受罚的历史监管信息;
将所述历史财务数据作为自变量,所述历史监管数据作为因变量对所述异常监测模型进行训练;
获取待预测企业的与企业财务数据特征对应的财务数据,输入完成训练的异常监测模型,对待预测企业未来受罚情况进行预测。
2.根据权利要求1所述的方法,其特征在于,所述企业财务数据特征包括直接企业财务数据特征和间接企业财务数据特征;
所述直接企业财务数据特征包括企业财务报表中的财务指标表征的特征;
所述间接企业财务数据特征包括除所述财务指标之外,表征企业财务能力的特征,和/或将直接企业财务数据特征经过预设数学计算后得到的特征。
3.根据权利要求1所述的方法,其特征在于,在获取到预设企业的与企业财务数据特征对应的历史财务数据,以及是否受罚的历史监管信息的样本数据之后,还包括如下类别不平衡处理过程:
判断获取到的样本数据中,正负样本数据之间的比例是否达到预设比例阈值;
当所述比例达到预设比例阈值时,采用预设方法对获取到的样本数据进行类别不平衡处理,得到类别平衡的样本数据。
4.根据权利要求1所述的方法,其特征在于,将所述历史财务数据作为自变量,所述历史监管数据作为因变量对所述异常监测模型进行训练,具体包括:
将所述历史财务数据作为自变量,所述历史监管数据作为因变量输入所述异常监测模型,并采用预设算法进行训练;
在一轮训练结束时,根据输出的接收者操作特征曲线下方的面积AUC值,判断所述异常监测模型当前使用的企业财务数据特征是否合理;
若不合理,采用预设特征选择方法对当前使用的企业财务数据特征进行调整,并基于调整后的特征对所述异常监测模型进行下一轮训练。
5.根据权利要求1所述的方法,其特征在于,所述异常监测模型包括多个预设模型;
将所述历史财务数据作为自变量,所述历史监管数据作为因变量对所述异常监测模型进行训练,具体包括:
将所述历史财务数据作为自变量,所述历史监管数据作为因变量,分别对所述多个预设模型进行训练;
基于所述多个预测模型对样本数据的预测结果,采用预设模型融合方法对所述多个预设模型进行融合处理,得到融合模型;
获取待预测企业的与企业财务数据特征对应的财务数据,输入完成训练的异常监测模型,对待预测企业未来受罚情况进行预测,具体包括:
获取待预测企业的与企业财务数据特征对应的财务数据,输入完成训练的融合模型,对待预测企业未来受罚情况进行预测。
6.根据权利要求5所述的方法,其特征在于,所述预设模型融合方法包括:模型集成方法;
基于所述多个预测模型对样本数据的预测结果,采用预设模型融合方法对所述多个预设模型进行融合处理,得到融合模型,具体包括:
将所述多个预测模型对样本数据的预测结果作为自变量,将所述预测结果对应的正确结果作为因变量,对融合模型进行训练,得到训练后的融合模型。
7.一种数据处理装置,其特征在于,所述装置包括:
模型构建模块,用于基于企业财务数据特征,构建用于预测企业未来是否受罚的异常监测模型;
数据获取模块,用于获取预设企业的与企业财务数据特征对应的历史财务数据,以及是否受罚的历史监管信息;
模型训练模块,用于将所述历史财务数据作为自变量,所述历史监管数据作为因变量对所述异常监测模型进行训练;
企业预测模块,用于获取待预测企业的与企业财务数据特征对应的财务数据,输入完成训练的异常监测模型,对待预测企业未来受罚情况进行预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国信优易数据有限公司,未经国信优易数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711484315.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:日切数据验证的方法、装置和电子设备
- 下一篇:一种跨境退税的处理方法和装置