[发明专利]互联网金融的风控预测方法在审
| 申请号: | 202210289069.5 | 申请日: | 2022-03-22 |
| 公开(公告)号: | CN114580783A | 公开(公告)日: | 2022-06-03 |
| 发明(设计)人: | 岳钧;李开恒;王正宁;周钊聿;周乐瑶 | 申请(专利权)人: | 四川省自然资源科学研究院(四川省生产力促进中心) |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q40/06;G06N3/04;G06N3/08 |
| 代理公司: | 北京天奇智新知识产权代理有限公司 11340 | 代理人: | 许驰 |
| 地址: | 610000 四*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 互联网 金融 预测 方法 | ||
1.互联网金融的风控预测方法,其特征在于,包括:
S1、构建初始的预测模型,预测模型包括第一模型和第二模型,第一模型的输出作为第二模型的输入;
S2、获取数据集;
S3、数据集导入第一模型,获得预测结果并导入第二模型,对预测模型进行训练优化,获得最优预测模型。
2.根据权利要求1所述的互联网金融的风控预测方法,其特征在于,在S1中,第一模型包括至少两个基础模型,基础模型为GBDTs(梯度提升树类模型)模型,第二模型为LSTM模型。
3.根据权利要求2所述的互联网金融的风控预测方法,其特征在于,第二模型的遗忘门表示为ft=σ(Wf[ht-1,xt]+bf),输入门表示为it=σ(Wi[ht-1,xt]+bi),单元状态表示为输出门表示为ot=σ(Wo[ht-1,xt]+bo),最终输出为ht=ot⊙tanh(ct),第二模型的完整输出表示为s(X)={h1,h2,...,ht},其中Wf是遗忘门的权重矩阵,[ht-1,xt]表示将其中的两个向量拼接成一个更长的向量,bf是遗忘门的偏置项,σ是Sigmoid函数,Wi是输入门的权重矩阵;bi是输入门的偏置项,单元状态ct是由上一次的单元状态ct-1按位乘以遗忘门ft。
4.根据权利要求2所述的互联网金融的风控预测方法,其特征在于,在S3中包括:
S31、数据集导入当下第一模型的每个基础模型,并获得预测值,数据集表示为(X,Yt),其中X为基础模型的输入,Yt为不同时刻的标签;
S32、对当下时刻所有的预测值进行加权累加,得到当下第一模型在当下时刻的预测结果,加权累加表示为其中xi为第i条数据,为对应的预测结果,yi为真实值,fk为第k个基础模型,每个基础模型得到的AUC值记为αi;wk为每个基础模型的权值,
S33、第一模型的输出定义为其中t表示不同时刻,第二模型的输入定义为X′,表示为
S34、X′导入当下第二模型,并根据当下第二模型的输出对当下预测模型进行训练优化,得到下一预测模型;
S35、判断下一预测模型是否为最优的预测模型,若是,则令下一预测模型作为最优预测模型并进入S4;反之则令下一预测模型作为当下预测模型,更新X′和Yt,X′更新为Yt更新为Yt+1,Yt+1←X′-gt(X),返回S31。
5.根据权利要求4所述的互联网金融的风控预测方法,其特征在于,在S35中,通过判断当前的迭代次数t是否达到设定的迭代次数N来判断下一预测模型是否为最优的预测模型,若下一预测模型不是最优的预测模型,则令t=t+1,再返回S31。
6.根据权利要求4所述的互联网金融的风控预测方法,其特征在于,计算每个模型的误差为∈i,这个误差服从零均值方差为且协方差为的多维正态分布,所有模型的平均预测所得误差是最终的平方误差的期望为:
7.根据权利要求1所述的互联网金融的风控预测方法,其特征在于,在S2和S3之间还包括S0、预处理数据,具体包括:
S01、删除数据集的异常列、空值列和重复值列;
S02、删除后的数据集进行归一化处理和标准化处理,归一化表示为标准化表示为其中X为数据集D中的目标字段的集合,x为待处理值,x′为处理后的值,min(*)、max(*)、mean(*)和std(*)分别表示取该字段的最小值、最大值、平均值和标准差;
S03、对归一化和标准化处理后的数据集进行独热编码、组合特征、字段拆分、业务特征和特征衍生操作构建数据集的特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川省自然资源科学研究院(四川省生产力促进中心),未经四川省自然资源科学研究院(四川省生产力促进中心)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210289069.5/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





