[发明专利]一种基于异质集成学习的欺诈预测方法、装置及电子设备在审
申请号: | 202011134320.8 | 申请日: | 2020-10-21 |
公开(公告)号: | CN112347393A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 孙涛;张涵 | 申请(专利权)人: | 上海淇玥信息技术有限公司 |
主分类号: | G06F16/955 | 分类号: | G06F16/955;G06F16/35 |
代理公司: | 北京清诚知识产权代理有限公司 11691 | 代理人: | 乔东峰 |
地址: | 201500 上海市崇明*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 集成 学习 欺诈 预测 方法 装置 电子设备 | ||
本发明公开了一种基于异质集成学习的欺诈预测方法、装置及电子设备,所述方法包括:将初始训练集切分为互斥的第一训练集和第二训练集,所述初始训练集包括涉及网络欺诈行为的历史数据,该历史数据包括用户属性信息和欺诈行为信息;在所述第一训练集中训练多个不同类型的初级学习器;根据所述第二训练集和训练好的所述多个初级学习器训练次级学习器;将测试集数据输入训练好的所述次级学习器中,根据输出结果预测欺诈行为。本发明将异质个体学习器结合起来,能够更加准确的识别不同类型的网络欺诈行为。并且通过互斥的第一训练集和第二训练集来减小初级学习器和次级学习器在训练过程中出现的过拟合问题。
技术领域
本发明涉及计算机信息处理技术领域,具体而言,涉及一种基于异质集成学习的欺诈预测方法、装置、电子设备及计算机可读介质。
背景技术
互联网的快速发展以及智能终端的普及,使得人们足不出户,就可以通过网络办理很多业务,如网上购物、电子银行等。但随之也会面临一些网络欺诈行为。
网络欺诈行为根据欺诈目的可以分为:营销作弊(如薅羊毛、虚假流量等)、支用欺诈(如套现行为)、金融欺诈(如骗贷、银行卡盗刷、额度盗刷等)、交易欺诈(如刷好评、刷差评、恶意占位、洗钱等)和账号欺诈(如钓鱼、虚假注册等)等。调查显示,网络欺诈行为日益复杂并向不同行业渗透,每年给全球带来高达4450亿美元的经济损失,并且已经发展成为一个组织严密、专业分工明确的黑色产业链,为互联网产业的发展带来严峻挑战。
现有技术中,对于网络欺诈行为的评估主要是通过人工的方式收集和获取客户的个人信息,再经过人工审核判断欺诈风险。这种评估方式因为带有主观性,其预测能力比较弱,且对于不同类型的网络欺诈行为,设置不同的风险评估标准。
发明内容
本发明旨在解决现有技术中对不同类型的网络欺诈行为识别能力弱的技术问题。
为了解决上述技术问题,本发明第一方面提出一种基于异质集成学习的欺诈预测方法,所述方法包括:
将初始训练集切分为互斥的第一训练集和第二训练集,所述初始训练集包括涉及网络欺诈行为的历史数据,该历史数据包括用户属性信息和欺诈行为信息;
在所述第一训练集中训练多个不同类型的初级学习器;
根据所述第二训练集和训练好的所述多个初级学习器训练次级学习器;
将测试集数据输入训练好的所述次级学习器中,根据输出结果预测欺诈行为。
根据本发明一种优选的实施方式,通过调节超参数的方式在所述第一训练集中训练多个同一类型的初级学习器。
根据本发明一种优选的实施方式,所述根据所述第二训练集和训练好的多个所述初级学习器训练次级学习器包括:
将训练好的所述多个初级学习器在所述第二训练集中做预测,生成次级训练集;
在所述初级训练集中训练次级学习器。
根据本发明一种优选的实施方式,所述多个不同类型的初级学习器的准确度大于预设准确度,且各个初级学习器之间的差异性大于预设值。
根据本发明一种优选的实施方式,所述初级学习器包括:孤立森林iForest、单类别支持向量机OCSVM和概率神经网络PNN。
根据本发明一种优选的实施方式,所述次级学习器为逻辑回归LR分类器。
根据本发明一种优选的实施方式,所述第一训练集和所述第二训练集在所述初始训练集中的占比分别为:70%和30%。
为了解决上述技术问题,本发明第二方面提供一种基于异质集成学习的欺诈预测装置,所述装置包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海淇玥信息技术有限公司,未经上海淇玥信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011134320.8/2.html,转载请声明来源钻瓜专利网。