[发明专利]一种数据特征重要性的分析方法及系统在审

专利信息
申请号: 202010464925.7 申请日: 2020-05-28
公开(公告)号: CN111612624A 公开(公告)日: 2020-09-01
发明(设计)人: 吴凌坤 申请(专利权)人: 深圳博普科技有限公司
主分类号: G06Q40/04 分类号: G06Q40/04;G06Q10/06;G06N3/00
代理公司: 深圳市智胜联合知识产权代理有限公司 44368 代理人: 齐文剑
地址: 518000 广东省深圳市福*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 特征 重要性 分析 方法 系统
【权利要求书】:

1.一种数据特征重要性的分析方法,其特征在于,包括:

获取债券风险评估所需的债券样本,并标记出债券样本中样本点的时间粒度,将其作为原始数据集;

对所述原始数据集进行预处理,获取均衡数据集;

构建用于分析数据特征重要性的随机森林模型;

将所述均衡数据集输入进所述随机森林中进行计算,分析出各个数据特征的重要性排名。

2.根据权利要求1所述的方法,其特征在于,所述债券风险评估所需的债券样本,具体为:所述债券样本的样本点以季度为时间粒度;

所述债券样本的样本点,具体为:按照所述样本点所对应的债券在季度中以是否发生过违约情况或重大风险事件为标准,从而标记出正负样本。

3.根据权利要求2所述的方法,其特征在于,所述正负样本,具体为:

当此债券在季度中发生过违约情况或重大风险事件时,标记为负样本;

当此债券在季度中未发生过违约情况或重大风险事件时,标记为正样本。

4.根据权利要求1所述的方法,其特征在于,所述对所述原始数据集进行预处理包括欠采样和过采样两种方法。

5.根据权利要求1所述的方法,其特征在于,所述随机森林模型,具体为:

利用bootstrap抽样方法从经过所述预处理后的均衡数据集N中有放回地重复随机抽取K个样本生成新的数据样本合集;

根据所述新的数据样本集生成T个分类树组成随机森林;

对每个经过所述bootstrap抽样法得来的样本进行决策树建模,组成多棵决策树进行预测,并通过投票得出最终预测结果。

6.根据权利要求5所述的方法,其特征在于,所述决策树,具体为:

每棵决策树由样本量为K的训练样本X和随机向量θk生成;

随机向量序列{θk,k=1,2,…,k}独立同分布;

随机森林即所有决策树的集合{h(X,θk),k=1,2,…,K};

每个决策树模型h(X,θk)均有一票投票权来选择输入变量x的分类结果:

其中,H(x)表示随机森林分类结果,hi(x)是单个决策树分类结果,Y表示分类目标,I(●)为示性函数。

7.根据权利要求1所述的方法,其特征在于,所述所述数据特征输入进所述随机森林中进行计算,具体为:

对于所述随机森林中的每一棵决策树,使用相应的袋外数据(OOB)来计算带外数据的预测误差,记为errOOB1;

随机的对所述袋外数据OOB所有样本的特征X加入噪声干扰,再次计算它的袋外数据误差,记为errOOB2;

设随机森林中有N棵树,那么特征X重要性=∑(eerOOB2-eerOOB1)/N。

8.一种数据特征重要性的分析系统,其特征在于,包括:

采集模块,用于获取债券风险评估所需的债券样本,将其作为原始数据集;

预处理模块,用于对所述原始数据集进行预处理,获取均衡数据集;

建模模块,用于构建用于分析数据特征重要性的随机森林模型;

计算模块,用于将所述均衡数据集输入进所述随机森林中进行计算,分析出各个数据特征的重要性排名。

9.电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至8中任一项所述的数据特征重要性的分析方法的步骤。

10.计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的数据特征重要性的分析方法的步骤。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳博普科技有限公司,未经深圳博普科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010464925.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top