[发明专利]一种面向时序数据的风险预测方法及系统有效
| 申请号: | 202010125879.8 | 申请日: | 2020-02-27 |
| 公开(公告)号: | CN111382930B | 公开(公告)日: | 2022-08-16 |
| 发明(设计)人: | 钱步月;潘迎港;刘洋;陈航;卫荣;李晓亮;李扬;张先礼 | 申请(专利权)人: | 西安交通大学 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/04;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 孟大帅 |
| 地址: | 710049 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 时序 数据 风险 预测 方法 系统 | ||
1.一种面向时序数据的风险预测方法,其特征在于,包括以下步骤:
步骤1,提取目标对象的消费记录、借贷款记录、资产记录中的事件实体和事件发生时间,组成时间-事件二元组集合,构造获得风险事件数据集;
步骤2,将风险事件数据集中的二元组数据映射为等维度的向量,获得与每个风险事件一一对应的时间-事件二元组实体向量集合;其中,映射时采用词嵌入操作,时间-事件二元组实体向量包括时间向量e和事件向量v;
步骤3,将步骤2获得的时间-事件二元组实体向量中的时间向量e与事件向量v进行向量加操作,获得包含时序特征和事件特征的词向量h;
步骤4,将步骤3获得的词向量h输入到预设的自注意力子网络模型进行计算处理,获得更新后的词向量h’;
步骤5,将步骤4获得的更新后的词向量h’输入到预定义好的基于位置的注意力子网络模型进行计算,获得风险事件的表征向量c;
步骤6,将步骤5获得的风险事件的表征向量c输入到线性分类器中分类,获得事件出现风险的概率;
步骤7,计算风险事件预测模型的损失,反向传播更新网络的参数权重,获得训练后的网络模型;所述风险事件预测模型包括:自注意力子网络模型和基于位置的注意力子网络模型;所述自注意力子网络模型的输出为所述基于位置的注意力子网络模型的输入;
步骤8,重复步骤7,直至风险事件预测模型结果满足预设收敛条件,获得训练好的风险事件预测模型;
步骤9,将待预测的风险事件输入步骤8获得的训练好的风险事件预测模型中,获取风险事件预测信息;其中,所述风险事件预测信息包括:风险事件发生的概率、影响风险事件结果的因素所占的比重;所述风险事件为目标对象在未来是否有偿还贷款的能力;
其中,步骤4中,预设的自注意力子网络模型包括:
MatMul层,用于计算两个输入向量的相似度;
Scale层,用于正则化MatMul层输出的相似度;
Mask层,用于将Scale层输出的相似度变长向量固定为定长向量;
其中,MatMul层的输出作为Scale层的输入,Scale层的输出作为Mask层输入;
步骤5中,预定义好的基于位置的注意力子网络模型包括:
线性计算,用于将子事件之间的位置信息加入子事件表征向量;
softmax函数,用于把线性计算操作输出的子事件表征向量中的元素映射到0~1之间;
加权平均操作,用于综合各风险子事件的特征αi生成风险事件的表征向量c;
步骤6中,所述线性分类器包括:
全连接层,用于实现输入数据的全连接操作;
softmax层,用于输出预测分类概率;其中,全连接层的输出作为softmax层的输入;
步骤7中,风险事件预测模型的损失函数采用交叉熵损失函数L,计算表达式为:
式中,L为网络损失,y为风险事件真实概率,为网络预测的事件概率。
2.根据权利要求1所述的一种面向时序数据的风险预测方法,其特征在于,步骤2中,词嵌入操作采用基于预测的跳字模型;其中,映射获得的等维度的向量的维度大于等于50且小于等于100。
3.根据权利要求1所述的一种面向时序数据的风险预测方法,其特征在于,步骤4中,初始化的自注意力子网络模型的权重参数包括W(Q)、W(K)、W(V),用于和步骤3获得的词向量h进行点乘操作,生成自注意力子网络模型的输入向量;其中,词向量h与权重参数W(Q)、W(K)、W(V)进行点乘得到Q、K、V三个向量,经过MatMul层,Q向量和K向量做点乘操作,计算每个子事件与其他子事件的相似度向量;然后,进入Scale层,对相似度进行正则化操作;然后,在Mask层对正则化后的相似度向量进行对齐操作,将变长的正则化后的相似度向量统一为固定长度,得到向量A;最后,再经过一次MatMul层,A向量与V向量进行点乘操作,输出更新后的词向量h’。
4.根据权利要求1所述的一种面向时序数据的风险预测方法,其特征在于,步骤5中,
首先,对词向量h’进行线性计算,获得含有位置信息的向量g,表达式为:
式中,和bα为风险事件预测模型需要训练的权重参数项和偏置项;
然后,对向量集g={g1,g2…gn}进行softmax操作,获得向量集α={α1,α2…αn},表达式为:
α1,α2…αn=softmax(g1,g2…gn),
式中,α={α1,α2…αn}代表各子风险事件的表征向量,g={g1,g2…gn}代表含有位置信息的词向量;
再后,将向量集α和词向量h’进行加权求和,获得风险事件的表征向量c,表达式为:
式中,αi代表各风险子事件的表征向量,hi′代表词向量,c代表风险事件的表征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010125879.8/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





