[发明专利]互联网金融平台网络借贷欺诈检测系统有效
| 申请号: | 201911101576.6 | 申请日: | 2019-11-12 |
| 公开(公告)号: | CN111028073B | 公开(公告)日: | 2023-05-12 |
| 发明(设计)人: | 王成;朱航宇;胡瑞鑫 | 申请(专利权)人: | 同济大学 |
| 主分类号: | G06Q40/03 | 分类号: | G06Q40/03 |
| 代理公司: | 上海科律专利代理事务所(特殊普通合伙) 31290 | 代理人: | 叶凤 |
| 地址: | 200092 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 互联网 金融 平台 网络 借贷 欺诈 检测 系统 | ||
1.一种网络借贷欺诈检测系统,嵌入于互联网网络借贷审核系统,其特征在于,连接网络借贷记录数据供应模块,本发明系统包括网络构建与更新模块、网络学习表征模块、特征构建模块、欺诈检测模型,其中:
所述数据供应模块可以针对不同的数据实现初始数据供应和流式数据供应;
所述网络构建与更新模块,与数据供应模块连接,包括关系借贷网络构建与更新模块、同质借贷网络的构建与更新模块,关系借贷网络构建与更新模块与同质借贷网络的构建与更新模块连接;
所述网络表征学习模块,与同质借贷网络的构建与更新模块连接,包括静态网络表征学习模块和增量式网络表征学习模块;
所述特征构建模块,实现将借贷数据转化为新特征的功能,包括数据向量化模块和时序特征构造模块,数据向量化模块输出与时序特征构造模块输入连接,静态网络表征学习模块和增量式网络表征学习模块的输出分别与数据向量化模块的输入连接;
所述欺诈检测模块,与特征构建模块连接,先通过对输入样本数据进行训练建立检测模块,再对测试数据实现欺诈检测,为互联网网络借贷审核系统提供检测判断;
具体为:
一、网络借贷记录数据供应模块
所述数据供应模块连接互联网金融平台借贷数据集,获得初始数据和流式数据,针对不同阶段向本发明系统供应训练用数据和测试数据;
二、网络构建与更新模块
关系借贷网络构建与更新模块:
从数据供应模块的原始借贷数据中筛选出可利用的原始字段,进行字段类型转换和空值去除填充数据预处理操作;将原始借贷数据划分为单号(APPLYNO)与属性(ATTRIBUTE)两种类型,所述属性(ATTRIBUTE)为借贷数据中除去单号(APPLYNO)以外的其他数据;针对一笔借贷数据,将其记为(bi,ATT(bi)),bi是借贷数据b的单号,ATT(bi)是借贷数据b对应的属性集合,attk(bi)是ATT(bi)中第k个元素;
基于原始借贷数据建立关系借贷网络Nr=(V,E),V是节点集,E是边集,其中边e1=(u,v),u与v属于节点集V;针对借贷数据b中的每一笔数据bi,首先bi加入节点集V,将ATT(bi)中每一个元素依次加入节点集V,最后将边(bi,attk(bi))加入边集E,attk(bi)是ATT(bi)中第k个元素;提供给同质借贷网络的构建与更新模块;
同质借贷网络的构建与更新模块:
基于关系借贷网络构建与更新模块建立同质借贷网络Nh=(Vh,Eh),Vh是节点集,Eh是边集,其中边e2=(u,v,w),u与v属于节点集Vh;当attk(bi)=attk(b-j)时,关系借贷网络中一对边(bi,attk(bi))和(bj,attk(bj))被视为边集Eh中的边(bi,bj),w为边(bi,bj)出现的次数,作为同质借贷网络Nh中的权重;基于关系借贷网络Nr,将节点集V中所有类型为借贷单号的节点加入节点集Vh;然后遍历每一对边(bi,attk(bi))和(bj,attk(bj)),当attk(bi)=attk(bj)时,将边(bi,bj)加入边集Eh;得到同质借贷网络Nh=(Vh,Eh);输出提供给网络表征学习模块;
三、网络学习表征模块
所述网络表征学习模块,与同质借贷网络的构建与更新模块连接,包括静态网络表征学习模块和增量式网络表征学习模块,分别在训练阶段和测试阶段完成网络表征学习;
所述静态网络表征学习模块:
基于同质借贷网络的构建与更新模块已构建的同质借贷网络Nh,静态网络表征学习模块采用网络表征学习方法NetWalk来学习同质借贷网络Nh中全部网络节点的向量表征;将网络表征学习方法NetWalk针对同质借贷网络Nh得到在初始时刻t时网络中节点v与其对应的向量表征γ,建立映射关系γ=Ft(v);依据映射关系γ=Ft(v),将初始借贷数据表示为向量表征形式,一笔由若干具体字段值组成借贷数据转变为一组固定维度的向量表征;
所述增量式网络表征学习模块进行生成增量式的网络表征,包括第一子模块、第二子模块、第三子模块、第四子模块,它们顺序连接:
所述第一子模块:依据数据集Btrain(tk)时间戳顺序,选取与数据集Btest(tk+1)同样数量的最早数据放入数据集B′test(tk+1);将数据集Btest(tk+1)与B′test(tk+1)采用与关系借贷网络构建与更新模块中相同的预处理操作,将处理后的数据集Btest(tk+1)与B′test(tk+1)基于数据集Btrain(tk)进行关系借贷网络的更新;基于关系借贷网络构建与更新模块的定义,分别处理网络借贷数据Btest(tk+1)与B′test(tk+1)得到关系借贷网络中的节点集Vtest(tk+1)和V′test(tk+1)与边集Etest(tk+1)和E′test(tk+1),Etest(tk+1)是流式到达的借贷数据中单号与上一时刻关系借贷网络Nr中现有节点之间的存在关系的边集,是关系借贷网络Nr即将删除的过期边集;令V=V∪Vtest(tk+1)-V′test(tk+1)和E=E∪Etest(tk+1)-E′test(tk+1),更新关系借贷网络Nr=(V,E);
所述第二子模块:基于更新后的关系借贷网络Nr=(V,E),采用同质借贷网络的构建与更新模块获得更新后的同质借贷网络Nh=(Vh,Eh);
所述第三子模块:基于时刻tk对应的节点v与对应向量γ的映射关系分别设置边集Etest(tk+1)和E′test(tk+1)为新到来的边集和待删除的边集,运用网络表征学习方法NetWalk,对涉及到边集Etest(tk+1)和E′test(tk+1)中的节点和边进行增量式的网络表征学习,得到时刻tk+1对应的节点v与对应向量γ的映射关系
所述第四子模块:将第三子模块针对同质借贷网络Nh得到在时刻tk时网络中节点v与其对应的向量表征γ之间的映射关系依据映射关系γ=Ft(v),将流式借贷数据重新表示为向量表征形式,一笔由若干具体字段值组成借贷数据转变为一组固定维度的向量表征;
四、特征构建模块
所述特征构建模块,实现将借贷数据转化为新特征的功能,包括数据向量化模块和时序特征构造模块,数据向量化模块输出与时序特征构造模块输入连接,静态网络表征学习模块和增量式网络表征学习模块的输出分别与数据向量化模块的输入连接。
所述数据向量化模块:一笔含有n个可用原始字段的借贷数据Btrain(tk)在同质借贷网络中可对应n个相应的节点,基于tk时刻节点和映射关系借贷数据变换为每个借贷单号所对应的维数为dim的向量,在得到向量后即可直接输入分类模型进行节点分类后续任务;
时序特征构造模块:在基于数据向量化模块所得到的向量表征,针对每一笔借贷数据依次先计算每个单号与在数据集中前h项单号的欧氏距离,单号按生成时间排序,并按照从小到大的顺序排序这h项,将其作为对应单号的所构造的时序特征;然后,再引入待检测单号与其前h项单号所对应向量相似度作为欺诈检测模型的输入;时序特征构造模块使用向量相似度,增强了后续欺诈检测模型的泛化能力,面对向量X=(x1,····,xdim)、Y=(y1,····,ydim),其欧氏距离的计算如下所示
基于时序特征构造模块中构造好的时序特征,依据分类器参数集Wc设置分类器,将tk时刻借贷数据对应的时序特征作为数据,对应借贷数据是否为欺诈交易作为标签,导入分类器进行训练,进而将训练好的二分类模型视为欺诈检测模型五、欺诈检测模块
所述欺诈检测模块,与特征构建模块连接,先通过对输入样本数据进行训练建立检测模块,再对测试数据实现欺诈检测,为互联网网络借贷审核系统提供检测判断;
在训练阶段,采用python中机器学习集成库scikit-learn中的XGBoost分类器为本发明的欺诈检测模型;
在测试阶段,基于特征构建模块的时序特征构造模块中构造好的时序特征,依据分类器参数集Wc设置分类器,将tk时刻借贷数据对应的时序特征作为数据,对应借贷数据是否为欺诈交易作为标签,导入分类器进行训练,进而将训练好的二分类模型视为欺诈检测模型
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911101576.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:光感控制电路及控制方法
- 下一篇:一种消息显示方法及电子设备





