[发明专利]一种基于自学习滑动时间窗口的网络支付欺诈检测方法有效
申请号: | 201811516440.7 | 申请日: | 2018-12-12 |
公开(公告)号: | CN109767225B | 公开(公告)日: | 2022-12-27 |
发明(设计)人: | 王成;王昌琪 | 申请(专利权)人: | 同济大学 |
主分类号: | G06Q20/40 | 分类号: | G06Q20/40;G06K9/62 |
代理公司: | 上海伯瑞杰知识产权代理有限公司 31227 | 代理人: | 孟旭彤 |
地址: | 200000 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自学习 滑动 时间 窗口 网络 支付 欺诈 检测 方法 | ||
1.一种基于自学习滑动时间窗口的网络支付欺诈检测方法,其特征在于,所述基于自学习滑动时间窗口的网络支付欺诈检测方法包括如下步骤:
获取实时检测的某个用户新来的一笔交易记录,并基于所述交易记录和预置的滑动时间窗口提取不依赖于所述滑动时间窗口的特征和依赖于所述滑动时间窗口的特征,其中,
所述不依赖于滑动时间窗口的特征包括交易的验签方式、当前交易是否使用该用户的常用IP地址、交易金额是否超过金额限额、交易金额是否超过交易前账户余额、两笔相邻交易的时间间隔、两笔相邻交易的交易金额差;
所述依赖于滑动时间窗口的特征包括滑动时间窗口内用户的交易次数、滑动时间窗口内所有交易金额的平均值、滑动时间窗口内所有交易金额的方差值、滑动时间窗口内所有交易金额的累积值、滑动时间窗口内相邻交易金额差的均值、滑动时间窗口内相邻交易金额差的方差值、滑动时间窗口内相邻交易时间间隔的均值、滑动时间窗口内相邻交易时间间隔的方差值;
将所述不依赖于滑动时间窗口的特征和所述依赖于滑动时间窗口的特征输入到训练完毕的随机森林分类器模型中,得到并返回所述交易记录存在欺诈可能性的概率;
所述获取实时检测的某个用户新来的一笔交易记录之前,包括如下步骤:
基于历史交易记录得到预置的滑动时间窗口和训练完毕的随机森林分类器模型;所述基于历史交易记录得到预置的滑动时间窗口和训练完毕的随机森林分类器模型包括如下步骤:
步骤S1:从历史交易记录中选取特定时间段内的交易记录,并判断所述特定时间段之前的时间段是否生成滑动时间窗口值,若无,则根据以下公式(1),
初始化滑动时间窗口大小的概率密度函数,其中N为滑动时间窗口大小候选集个数;
若有,则根据前一个时间段的滑动时间窗口值xl和公式(2),
初始化滑动时间窗口大小的概率密度函数,其中σ2为滑动时间窗口大小的概率密度函数初始化的超参数,xl为前一个时间段的滑动时间窗口值;
步骤S2:在t时刻按照概率从滑动时间窗口大小的概率密度函数ft(x)中选择出一个滑动时间窗口值xt;在滑动时间窗口值xt下,为所述特定时间段内的交易记录分别提取出依赖于所述滑动时间窗口值xt的特征,并结合不依赖于滑动时间窗口值xt的特征和标签组成训练样本集合,所述标签指的是历史交易记录是否是欺诈交易的标记;
步骤S3:将所述训练样本集合输入随机森林分类器进行模型训练,得到随机森林分类器模型;提取所述特定时间段内预设时间段内的交易记录并根据公式(3),
tprt=0.4*(tprt|fprt=0.05%)+0.3*(tprt|fprt=0.1%)+0.2*(tprt|fprt=0.5%)+0.1*(tprt|fprt=1.0%) (3)
得到t时刻的随机森林分类器模型性能评价指标,也即加权tpr值tprt,再将t时刻的加权tpr值tprt加入集合TPR中,去除集合TPR中对应t-m时刻的加权tpr值tprt-m值,使得集合TPR的大小保持为m,其中,公式(3)中的fprt代表t时刻的随机森林分类器模型的打扰率性能指标,m为集合TPR的大小;
步骤S4:根据t时刻的加权tpr值tprt、集合TPR、集合TPR的中值TPRmed和最大值TPRmax,利用公式(4)
判断所述滑动时间窗口值xt下的随机森林分类器模型的加权tpr值是否高于随机森林分类器模型性能集合TPR中的中值TPRmed,以此计算出t时刻选择的滑动时间窗口值xt下的奖励值βt,并反馈给学习自动机;
步骤S5:学习自动机接收到奖励值βt后,根据在t时刻滑动时间窗口大小的概率密度函数,按照公式(5)
更新得到t+1时刻的滑动时间窗口大小的概率密度函数ft+1(x);在t+1时刻的滑动时间窗口大小的概率密度函数中,当某个滑动时间窗口值所对应的概率值低于预置阈值th时,则将所述概率值设为0,并对整个滑动时间窗口大小的概率密度函数作归一化处理,使得所有滑动时间窗口大小值对应的概率之和为1;其中,λ和σ1为高斯邻居函数的超参数,α为归一化参数,其值为所有滑动时间窗口值的概率密度之和的倒数;
步骤S6:重复步骤S2-S5,经过iter次迭代后停止迭代,输出对应概率值最高的滑动时间窗口值作为预置的滑动时间窗口,同时得到训练完毕的随机森林分类器模型,其中,iter为学习自动机迭代次数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811516440.7/1.html,转载请声明来源钻瓜专利网。