[发明专利]一种基于多模型融合的交易流水处理方法及系统在审
申请号: | 202011567495.8 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112561530A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 李振;尹正;张刚;鲍东岳;刘昊霖;傅佳美;赵希;任鹏飞;李千惠;黑小波;刘蓓 | 申请(专利权)人: | 民生科技有限责任公司 |
主分类号: | G06Q20/38 | 分类号: | G06Q20/38;G06F16/2457;G06F40/289;G06N3/08;G06N3/04 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 巴晓艳 |
地址: | 101300 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 模型 融合 交易 流水 处理 方法 系统 | ||
一种基于多模型融合的交易流水处理方法及系统,涉及智能分类技术领域,方法包括S1:收集交易流水样本构建训练集;S2:对训练集进行预处理,得到每个交易流水样本的输入向量;S3:将输入向量分别代入LightGBM、SVM和Softmax进行训练,结合训练后的三个模型完成待分类交易流水一级标签的预测;S4:在所述S3预测的一级标签的基础上,利用卷积神经网络模型完成待分类交易流水二级标签的预测。本发明所述的方法采用层级分类体系,能够快速准确的向用户展示消费类型标签,并具有纠错、自主学习的特点,与用户产生良好互动,提升用户体验。
技术领域
本发明涉及智能分类技术领域,尤其是涉及一种基于多模型融合的交易流水处理方法及系统。
背景技术
收支明细,即指记录了客户对应账户所有交易流水的数据,一般包括交易时间、客户名称、交易金额等基础信息供客户查看。如今,随着互联网的发展,便捷支付开启了手机支付的新时代,线上线下交易量及交易流水急速增长,同时人们对收支功能的需求也不断提高,收支明细数据的实时化和透明化则成为金融支付市场的大趋势。
据统计,“查看收支明细”已成为当前客户登陆网上银行APP后最常使用的功能之一,基于用户需求优化收支明细的内容和展现形式,可以大大提升用户体验,从而增强用户粘性。目前大部分网上银行APP向用户展示的支出明细仅包含交易时间、交易账户、客户名称、交易金额等基本信息,而对于每笔支出的消费类型、总消费类型占比等个性化信息并没有相关数据的呈现,导致用户对个人单笔交易的收入或支出、收入来源或渠道、支出去向或类型并无明确且直观的认识。
发明内容
有鉴于此,本发明提出了一种基于多模型融合的交易流水处理方法及系统,采用层级分类体系,提供一种基于机器学习多模型融合和卷积神经网络模型的交易流水处理系统。该系统可实现对用户交易流水的实时标记,能够快速准确的向用户展示消费类型标签,并具有纠错、自主学习的特点,与用户产生良好互动,提升用户体验。
为实现上述目的,本发明采用如下技术方案:
根据本发明的第一方面,提供了一种基于多模型融合的交易流水处理方法,所述方法包括以下步骤:
S1:收集交易流水样本构建训练集,所述样本包括交易流水数据以及与交易流水数据对应的一级标签和二级标签;
S2:对训练集进行预处理,得到每个交易流水样本的输入向量;
S3:将输入向量分别代入轻型梯度提升回归树模型、支持向量机模型和逻辑回归模型进行训练,结合训练后的三个模型完成待分类交易流水一级标签的预测;
S4:在所述S3预测的一级标签的基础上,利用卷积神经网络模型完成待分类交易流水二级标签的预测;
S5:将错误预测结果修正后作为新的样本组成训练集,重复所述步骤S2~S4,完成模型的优化。
进一步的,所述S1中的交易流水数据包括多个字段,所述字段包括名称、备注、金额、交易时间。
进一步的,所述S2具体包括:
S21:去除训练集交易流水数据中的特殊字符和停用词;
S22:对交易流水数据的每个字段进行分词处理;
S23:将分词后得到的词语转化为词向量;
S24:将每个字段的所有词向量累加并取平均值得到字段向量;
S25:将每个样本的字段向量进行拼接,得到每个样本的输入向量集合。
进一步的,所述S23中采用word2vec模型完成词语到词向量的转换,能够克服离散表示模型在构建词典时产生的巨大维度灾难及向量稀疏的弊端。
进一步的,所述S3具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于民生科技有限责任公司,未经民生科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011567495.8/2.html,转载请声明来源钻瓜专利网。