[发明专利]一种基于特征提取的信用卡欺诈检测方法在审
| 申请号: | 201910715339.2 | 申请日: | 2019-08-05 |
| 公开(公告)号: | CN112330328A | 公开(公告)日: | 2021-02-05 |
| 发明(设计)人: | 方勇;黄诚;张芸芸;张与驰 | 申请(专利权)人: | 四川大学 |
| 主分类号: | G06Q20/40 | 分类号: | G06Q20/40;G06K9/62 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 610065 四川*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 特征 提取 信用卡 欺诈 检测 方法 | ||
信用卡由于支付便利、具有折扣和优惠、暂缓经济压力等优势被人们广泛使用,在这一过程中,越来越多的信用卡欺诈问题开始浮现,因此有效地检测信用卡欺诈至关重要。本发明提出一种基于特征提取的信用卡欺诈检测方法,该方法从数据出发,提取数据中包含的特征向量,使用图数据库去关联特征向量,再运用深度学习技术分析,从而实现自动快速地检测信用卡欺诈行为,提高检测的准确性。
技术领域
本发明提出了一种基于特征提取的信用卡欺诈检测方法,用于检测信用卡的欺诈行为。通过提取信用卡交易数据的特征向量,使用基于深度学习的算法从而实现自动快速地检测出信用卡交易中的欺诈行为。
背景技术
紧随着互联网快速发展的脚步,人们的思维方式和生活方式也发生了翻天覆地的变化。人们从现金支付变成了网上支付,信用卡由于其具有能为持卡人提供支付便利,暂时缓解经济压力等优势,逐渐占领市场。由于信用卡支付是线上支付,这给人们带来了一些安全方面的困扰,主要包括三个方面:一是风险来源于持卡人,持卡人利用信用卡恶意透支;二是风险来源于商家,商家工作人员持卡离开顾客的视线,使用顾客的信用卡进行消费;三是风险来源于第三方,黑客攻击个人电脑,盗取用户信息。信用卡欺诈存在八种主要的欺诈应用场景:注册,登录,实名认证,商品浏览,下单,支付,评价和推广营销。
信用卡包含了大量的个人信息,银行业也在逐步地规避信用卡欺诈带来的风险和损失。他们使用先验知识对原始数据进行统计分析,使用逻辑回归方法去预测二项式结果,但是耗时较长。
随着深度学习技术的发展,深度学习在提取特征方面已经取得了令人瞩目的成绩。对信用卡欺诈行为的检测实际上是提取其中的文本信息、职业、手机号码、年龄等,使用图数据库关联特征向量,再运用深度学习技术分析,并对信用卡欺诈行为进行检测。
发明内容
本发明根据上述存在的问题以及现有的技术,提出一种基于特征提取的信用卡欺诈检测方法,用于检测信用卡的欺诈行为,具体方法如下:
(1)针对从网上公开获取的数据集进行样本标记,将样本分为正常样本集和欺诈样本集;
(2)对标记后的样本集进行空值判断,删除掉缺失的数据;
(3)利用分类类型固定的特征提升模型分类的效率;
(4)使用Smote算法平衡信用卡交易数据集,并且按照训练集和测试集7:3的比例对样本集进行划分;
(5)对样本数据集进行文本信息筛选,统计一些高频词出现的次数;
(6)将信息筛选后的文本进行训练从而得到词向量模型,利用此模型可以获取与信用卡欺诈相关的特征向量;
(7)基于Neo4j图数据库对词向量模型提取的特征向量进行关联,得到新的关系点,最终获得处理好的特征向量;
(8)把最终的特征向量输入深度信念网络DBN中,训练出分类器以构建信用卡欺诈检测模型。
依据上述方法,本发明采用了如下的技术方案:基于特征提取的信用卡欺诈检测方法主要包括了三个模块:数据预处理模块、文本特征提取模块、信用卡欺诈检测模块,每个模块应包含相应的功能。
数据预处理模块:
(1)样本标记。对于从网上公开获取的信用卡交易样本集, 其中有一项命名为fraud的标签,标签值为1代表是欺诈样本,标签值为0代表是正常样本。因此,将样本集分为两类:欺诈样本集和正样本集;
(2)样本检测。样本集中的某些样本存在缺失信息,于是需要对样本集进行空值判断,最后处理掉缺失的数据;
(3)特征分类。信用卡交易数据集中的有些特征的分类类型是固定的,利用这些特征划分对应的类别以提高模型的训练效率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910715339.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电连接器
- 下一篇:一种基于自编码器的Web攻击行为检测系统





