[发明专利]风险概率的计算方法、装置和计算机设备有效
申请号: | 201910601111.0 | 申请日: | 2019-07-04 |
公开(公告)号: | CN110458324B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 车驰;秦鹏;权佳成;张瑜;谭瑞 | 申请(专利权)人: | 赣州市银税之家企业服务有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q10/0635;G06Q40/12;G06F40/289;G06F16/35 |
代理公司: | 长沙明新专利代理事务所(普通合伙) 43222 | 代理人: | 叶舟 |
地址: | 341000 江西省赣州市赣*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 风险 概率 计算方法 装置 计算机 设备 | ||
本申请属于大数据分析领域,揭示了一种风险概率的计算方法、装置和计算机设备。本申请通过获取到企业以及与企业关联的关联企业的网络上的碎片化数据,得到的数据维度丰富,并进行了数据的多种预处理工程,然后使用传染病模型对企业关联关系中的风险传导进行分析转换,以数值化的方式体现企业的关联风险,最后使用多层模型融合的方式,提高了预测企业债务违约风险模型的预测正确率。
技术领域
本申请涉及到大数据分析领域,特别是涉及到一种风险概率的计算方法、装置和计算机设备。
背景技术
目前市面上的企业违约模型的构建使用的数据维度较少,模型构建简单,并且没有关注主体监控企业的关联风险;基于以上原因,企业债务风险模型的正确率不足以达到业务运用要求。
发明内容
本申请的主要目的为提供一种风险概率的计算方法、装置和计算机设备,旨在解决现有技术中企业债务违约风险预测准确率低的问题。
为了实现上述发明目的,本申请提出一种风险概率的计算方法,包括:
获取待预测的企业的企业信息;
依据所述企业信息,获取与所述企业相关联的各关联企业,以及各所述关联企业的关联企业信息;
根据所述企业信息获取所述企业的碎片化信息,得到第一组碎片化信息,以及根据各所述关联企业信息分别获取各所述关联企业的碎片化信息,得到多组的第二组碎片化信息;其中,所述第一组碎片化信息和第二组碎片化信息均为文本信息;
将所述第一组碎片化信息进行信息分类,得到信息分类后的第一组分类信息集合,以及将各所述第二组碎片化信息进行信息分类,得到信息分类后的多个第二组分类信息集合;
将所述第一组分类信息集合进行数字化,得到第一数据矩阵,以及将各所述第二组分类信息集合进行数字化,得到多个第二数据矩阵;
将所述第一数据矩阵和各所述第二数据矩阵输入到预设的传染病模型中进行计算,得到融合后的第三数据矩阵;
将所述第三数据矩阵输入到预设的预测企业债务违约风险模型中进行计算,得到所述企业的债务违约风险概率值。
进一步地,所述将所述第三数据矩阵输入到预设的预测企业债务违约风险模型中进行计算,得到所述企业的债务违约风险概率值的步骤,包括:
使用xgboosting算法对所述第三数据矩阵进行预建模,以对所述第三数据矩阵中的各数据特征维度的权重进行排序;
抽取指定排名之前的数据特征维度作为后续模型训练的输入参数;
将所述输入参数分别输入到多个预设的基准模型中进行计算,并以boosting的方式进行融合得到所述企业的债务违约风险概率值。
进一步地,所述将所述第一组碎片化信息进行信息分类,得到信息分类后的第一组分类信息集合,以及将各所述第二组碎片化信息进行信息分类,得到信息分类后的多个第二组分类信息集合的步骤,包括:
使用预设的分词模型对第一组碎片化信息进行分词处理,得到第一组分词集合,以及使用所述分词模型对各第二组碎片化信息进行分词处理,得到与各第二组碎片化信息对应的第二组分词集合;
使用预设的词向量模型,将第一组分词集合中的各分词进行向量化,得到第一组向量化数据,以及使用所述词向量模型,将各第二组分词集合中的各分词进行向量化,得到与各第二组碎片化信息对应的多组第二组向量化数据;
对第一组向量化数据进行降维处理,得到第一组碎片化信息的第一向量化表示,以及对各第二组向量化数据进行降维处理,得到各第二组碎片化信息的第二向量化表示;
利用预设的分类模型分别对第一向量化表示和各第二向量化表示进行分类,到所述第一组分类信息集合和各所述第二组分类信息集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赣州市银税之家企业服务有限公司,未经赣州市银税之家企业服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910601111.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理