[发明专利]基于深度学习的高斯混合模型银行交易数据模拟生成算法在审

申请号：	202110635012.1	申请日：	2021-06-08
公开（公告）号：	CN113435997A	公开（公告）日：	2021-09-24
发明（设计）人：	韩景光	申请（专利权）人：	成都熵焓科技有限公司
主分类号：	G06Q40/02	分类号：	G06Q40/02;G06Q40/04;G06K9/62
代理公司：	成都科奥专利事务所(普通合伙) 51101	代理人：	苏亚超
地址：	610000 四川省成都市***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于深度学习混合模型银行交易数据模拟生成算法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种基于深度学习的高斯混合模型银行交易数据模拟生成方法和系统，解决反欺诈过程中负样本数量过少的问题，同时解决大数据集中的样本数据分布不均问题。减少正常交易误以为是欺诈的误报，有效降低误报率，提高银行交易中对反欺诈信息的监管。

技术领域

本发明属于金融科技领域、人工智能、大数据，尤其涉及数据模拟与生成

背景技术

不同的银行有自己的主营业务，如消费银行的业务包括：反欺诈、监控客户流失情况、抵押/贷款等业务等；企业银行的业务包括：反欺诈、银行收费增值服务等；投资银行的业务包括：反欺诈、投资分析服务等。上述银行交易数据中反欺诈的负样本数据相对与正常的银行交易数据十分的稀少，由于反欺诈中的负样本数据太少，就会出现正常交易误以为是欺诈，要很多人工对该银行交易数据进行再度复查，为了避免上述情况的出现，本发明提出一种基于深度学习的高斯混合模型银行交易数据模拟生成算法，来丰富反欺诈中的负样本数量，减少正常交易误以为是欺诈的误报，有效降低误报率，提高银行交易中对反欺诈信息的监管。

发明内容

为解决上述问题，提供一种银行交易数据模拟生成算法，来丰富反欺诈中的负样本数据，本发明的技术方案是，

一种基于深度学习的高斯混合模型银行交易数据模拟生成方法，包括，

获取银行真实交易数据；

对银行真实交易数据类型过滤，仅读取所需的数据并进行多路分解为不同属性的银行交易流之间的样本记录，其中，所述不同属性包括但不限于交易金额、交易类型和交易主体；

对不同属性的单个交易流进行分别进行模拟，其中，在单个交易流进行分别进行模拟时，进行预配置参数和分布参数评估，生成交易维度的概率分布的数据特征；

将经过预配置参数和分布参数评估的数据，通过随机数生成器生成数字序列，所述数字序列以用作数字属性值采样集索引或用于随机生成分类值的输入；所述采样集是根据实际银行交易数据分布进行排序和组织的，这种分布可近似为样本集中的样本重复；

所述数字序列的数字将落入采样设置范围内，获得选取的样本，将所述样本作为进行模拟完成的单个交易流；

将分别进行模拟完成的单个交易流输出合并。

进一步的，所述分布参数评估，使用高斯混合模型进行分布参数评估的问题推理；

给出一组数据

X＝{x₁，x₂...x_n}