[发明专利]一种基于多模型融合的交易流水处理方法及系统在审
申请号: | 202011567495.8 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112561530A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 李振;尹正;张刚;鲍东岳;刘昊霖;傅佳美;赵希;任鹏飞;李千惠;黑小波;刘蓓 | 申请(专利权)人: | 民生科技有限责任公司 |
主分类号: | G06Q20/38 | 分类号: | G06Q20/38;G06F16/2457;G06F40/289;G06N3/08;G06N3/04 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 巴晓艳 |
地址: | 101300 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模型 融合 交易 流水 处理 方法 系统 | ||
1.一种基于多模型融合的交易流水处理方法,其特征在于,所述方法包括以下步骤:
S1:收集交易流水样本构建训练集,所述样本包括交易流水数据以及与交易流水数据对应的一级标签和二级标签;
S2:对训练集进行预处理,得到每个交易流水样本的输入向量;
S3:将输入向量分别代入轻型梯度提升回归树模型、支持向量机模型和逻辑回归模型进行训练,结合训练后的三个模型完成待分类交易流水一级标签的预测;
S4:在所述S3预测的一级标签的基础上,利用卷积神经网络模型完成待分类交易流水二级标签的预测。
2.根据权利要求1所述的一种基于多模型融合的交易流水处理方法,其特征在于,所述S1中的交易流水数据包括多个字段,所述字段包括名称、备注、金额、交易时间。
3.根据权利要求2所述的一种基于多模型融合的交易流水处理方法,其特征在于,所述S2具体包括:
S21:去除训练集交易流水数据中的特殊字符和停用词;
S22:对交易流水数据的每个字段进行分词处理;
S23:将分词后得到的词语转化为词向量;
S24:将每个字段的所有词向量累加并取平均值得到字段向量;
S25:将每个样本的字段向量进行拼接,得到每个样本的输入向量集合。
4.根据权利要求1所述的一种基于多模型融合的交易流水处理方法,其特征在于,将错误预测结果修正后作为新的样本组成训练集,重复所述步骤S2~S4,能够完成模型的优化。
5.根据权利要求1所述的一种基于多模型融合的交易流水处理方法,其特征在于,所述S3具体包括:
S31:将训练集中的交易流水数据及与交易流水数据对应的一级标签输入轻型梯度提升回归树模型进行训练,基于训练好的轻型梯度提升回归树模型预测得到待分类的交易流水数据属于各个一级标签的概率PL(j),其中j代表一级标签的编号;
S32:将训练集中的交易流水数据及与交易流水数据对应的一级标签输入支持向量机模型进行训练,基于训练好的支持向量机模型预测得到待分类交易流水属于各个一级标签的概率PSVM(j);
S33:将训练集中的交易流水数据及与交易流水数据对应的一级标签输入逻辑回归模型进行训练,基于训练好的逻辑回归模型预测得到待分类交易流水属于各个一级标签的概率PS(j);
S34:计算各个一级标签的概率平均值Pj=(PL(j)+PSVM(j)+PS(j))/3,选择概率平均值最大的一级标签作为待分类交易流水的一级标签预测结果。
6.根据权利要求1所述的一种基于多模型融合的交易流水处理方法,其特征在于,所述S4具体包括:
S41:按照训练集中的一级标签将训练集划分为若干个子训练集;
S42:分别将每个子训练集所包含的交易流水数据及与交易流水数据对应的二级标签输入卷积神经网络进行训练,获得分别与每个一级标签对应的多个卷积神经网络模型;
S43:选择与所述S3输出的待分类交易流水一级标签对应的卷积神经网络模型,完成对待分类交易流水二级标签的预测。
7.根据权利要求6所述的一种基于多模型融合的交易流水处理方法,其特征在于,所述卷积神经网络模型包括:
输入层,用于将交易流水样本转化为神经网络输入向量;
卷积层,用于提取每个所述神经网络输入向量中的文本特征;
池化层,用于从所述文本特征中筛选出重要特征;
全连接层,用于将所述重要特征连接至分类器,得到待分类交易流水属于各个二级标签的概率;
预测层,用于将对应最大概率的二级标签作为预测结果输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于民生科技有限责任公司,未经民生科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011567495.8/1.html,转载请声明来源钻瓜专利网。