[发明专利]一种面向时序数据的风险预测方法及系统有效
| 申请号: | 202010125879.8 | 申请日: | 2020-02-27 |
| 公开(公告)号: | CN111382930B | 公开(公告)日: | 2022-08-16 |
| 发明(设计)人: | 钱步月;潘迎港;刘洋;陈航;卫荣;李晓亮;李扬;张先礼 | 申请(专利权)人: | 西安交通大学 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/04;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 孟大帅 |
| 地址: | 710049 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 时序 数据 风险 预测 方法 系统 | ||
本发明公开了一种面向时序数据的风险预测方法及系统,包括:获取样本集合中每个风险事件的时间信息和内容信息;将事件信息通过词嵌入技术转换为等维度高维向量;用风险事件向量对预设的预测模型进行训练,获得训练后的风险预测网络模型;用获得的风险预测网络模型处理待预测的风险事件,输出风险事件的风险水平和影响水平的因素所占比重。本发明通过注意力机制和深度网络,可以在保证模型高精确度的前提下,并行训练网络而且可对预测结果进行分析,可解释性强,具有说服力。
技术领域
本发明属于数据处理和机器学习技术领域,特别涉及一种面向时序数据的风险预测方法及系统。
背景技术
在过去的十年中,诸如个人信用消费记录、医疗临床数据、信息系统安全数据的快速积累和传播,为风险事件预测提供了可能性。利用传统的机器学习方法来处理这些时序性、异质性和高维性的数据,会给算法带来极大的困难和挑战。
现有的循环神经网络模型虽然可以处理海量的数据并且获得较为满意的效果,但是其仍然存在较大问题。首先,循环神经网络模型不能处理长时序数据,其性能会随着时序数据的增加而快速下降;而且,循环神经网络模型因为本身结构的原因不能并行训练网络模型,模型训练耗费大量时间;最后,循环神经网络模型最终只能输出风险事件的预测结果,并不能对预测结果进行详细且有效的解释,降低了模型的说服力。
综上,亟需一种新的面向时序数据的可解释可并行的风险预测方法及系统。
发明内容
本发明的目的在于提供一种面向时序数据的风险预测方法及系统,进而至少在一定程度上克服由于上述相关技术的限制和缺陷而导致的一个或多个技术问题。
为达到上述目的,本发明采用以下技术方案:
本发明的一种面向时序数据的风险预测方法,包括以下步骤:
步骤1,获取预设数量已判断的风险事件样本集合,提取风险事件样本集合中的事件实体和事件发生时间,组成时间-事件二元组集合,构造获得风险事件数据集;
步骤2,将风险事件数据集中的二元组数据映射为等维度的向量,获得与每个风险事件一一对应的时间-事件二元组实体向量集合;其中,映射时采用词嵌入操作,时间-事件二元组实体向量包括时间向量e和事件向量v;
步骤3,将步骤2获得的时间-事件二元组实体向量中的时间向量e与事件向量v进行向量加操作,获得包含时序特征和事件特征的词向量h;
步骤4,将步骤3获得的词向量h输入到预设的自注意力子网络模型进行计算处理,获得更新后的词向量h’;
步骤5,将步骤4获得的更新后的词向量h’输入到预定义好的基于位置的注意力子网络模型进行计算,获得风险事件的表征向量c;
步骤6,将步骤5获得的风险事件的表征向量c输入到线性分类器中分类,获得事件出现风险的概率;
步骤7,计算整个风险事件预测模型的损失,反向传播更新网络的参数权重,获得训练后的网络模型;所述风险事件预测模型包括:自注意力子网络模型和基于位置的注意力子网络模型;所述自注意力子网络模型的输出为所述基于位置的注意力子网络模型的输入;
步骤8,重复步骤7,直至风险事件预测模型结果满足预设收敛条件,获得训练好的风险事件预测模型;
步骤9,将待预测的风险事件输入步骤8获得的训练好的风险事件预测模型中,获取风险事件预测信息;其中,所述风险事件预测信息包括:风险事件发生的概率、影响风险事件结果的因素所占的比重。
本发明的进一步改进在于,步骤1中,提取风险事件样本集合中的事件实体时,同一事件实体只提取一次;提取获得的事件实体包含一个或多个子事件信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010125879.8/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





