[发明专利]基于深度学习的高斯混合模型银行交易数据模拟生成算法在审
| 申请号: | 202110635012.1 | 申请日: | 2021-06-08 |
| 公开(公告)号: | CN113435997A | 公开(公告)日: | 2021-09-24 |
| 发明(设计)人: | 韩景光 | 申请(专利权)人: | 成都熵焓科技有限公司 |
| 主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q40/04;G06K9/62 |
| 代理公司: | 成都科奥专利事务所(普通合伙) 51101 | 代理人: | 苏亚超 |
| 地址: | 610000 四川省成都市*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 学习 混合 模型 银行 交易 数据 模拟 生成 算法 | ||
本发明提供一种基于深度学习的高斯混合模型银行交易数据模拟生成方法和系统,解决反欺诈过程中负样本数量过少的问题,同时解决大数据集中的样本数据分布不均问题。减少正常交易误以为是欺诈的误报,有效降低误报率,提高银行交易中对反欺诈信息的监管。
技术领域
本发明属于金融科技领域、人工智能、大数据,尤其涉及数据模拟与生成
背景技术
不同的银行有自己的主营业务,如消费银行的业务包括:反欺诈、监控客户流失情况、抵押/贷款等业务等;企业银行的业务包括:反欺诈、银行收费增值服务等;投资银行的业务包括:反欺诈、投资分析服务等。上述银行交易数据中反欺诈的负样本数据相对与正常的银行交易数据十分的稀少,由于反欺诈中的负样本数据太少,就会出现正常交易误以为是欺诈,要很多人工对该银行交易数据进行再度复查,为了避免上述情况的出现,本发明提出一种基于深度学习的高斯混合模型银行交易数据模拟生成算法,来丰富反欺诈中的负样本数量,减少正常交易误以为是欺诈的误报,有效降低误报率,提高银行交易中对反欺诈信息的监管。
发明内容
为解决上述问题,提供一种银行交易数据模拟生成算法,来丰富反欺诈中的负样本数据,本发明的技术方案是,
一种基于深度学习的高斯混合模型银行交易数据模拟生成方法,包括,
获取银行真实交易数据;
对银行真实交易数据类型过滤,仅读取所需的数据并进行多路分解为不同属性的银行交易流之间的样本记录,其中,所述不同属性包括但不限于交易金额、交易类型和交易主体;
对不同属性的单个交易流进行分别进行模拟,其中,在单个交易流进行分别进行模拟时,进行预配置参数和分布参数评估,生成交易维度的概率分布的数据特征;
将经过预配置参数和分布参数评估的数据,通过随机数生成器生成数字序列,所述数字序列以用作数字属性值采样集索引或用于随机生成分类值的输入;所述采样集是根据实际银行交易数据分布进行排序和组织的,这种分布可近似为样本集中的样本重复;
所述数字序列的数字将落入采样设置范围内,获得选取的样本,将所述样本作为进行模拟完成的单个交易流;
将分别进行模拟完成的单个交易流输出合并。
进一步的,所述分布参数评估,使用高斯混合模型进行分布参数评估的问题推理;
给出一组数据
X={x1,x2...xn}
根据未知的分布,估计参数θ拟合数据的改成高斯混合模型
其中μ为数据均值,σ为数据标准差,k是混合模型中子高斯模型的数量,N观测数据样本的数量,Wi是观测数据属于第i个子模型的概率;
给定的约束
0<wi<1;
分布参数的估计采用似然最大化法P(X/θ);这表示与模型参数有关的数据集的概率
最大期望算法,从实际训练数据中自动估计数值属性的分布;高斯混合分布参数通过期望最大化算法计算:
分完成分布参数评估。
进一步的,所述分布估计过程包括
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都熵焓科技有限公司,未经成都熵焓科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110635012.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种波动牙刷
- 下一篇:一种β晶聚丙烯抗老化土工布及其制备方法





