[发明专利]一种基于机器学习的电信反欺诈方法在审

专利信息
申请号: 202210034458.3 申请日: 2022-01-13
公开(公告)号: CN114513791A 公开(公告)日: 2022-05-17
发明(设计)人: 吴勇;顾强峰;梁晓龙;徐梦蝶;李炳;梁建斌;陈一蕾 申请(专利权)人: 浙江鸿程计算机系统有限公司
主分类号: H04W12/128 分类号: H04W12/128;G06N20/00
代理公司: 杭州之江专利事务所(普通合伙) 33216 代理人: 张慧英
地址: 310000 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 机器 学习 电信 欺诈 方法
【权利要求书】:

1.一种基于机器学习的电信反欺诈方法,其特征在于,包括如下步骤:

(1)根据历史所有的通报号码和通报的内容分析梳理,不同场景梳理,将潜在电信诈骗用户细分,深入挖掘用户分群,刻画出目标用户的特征;

(2)进行数据采集,针对现有存量用户采集其各个维度的特征,从用户的基本属性,通话行为数据,套餐入网信息,消费使用特征,终端标记信息,衍生变量这六大维度入手,细分成178个特征,构建号卡的活跃行为宽表,采集用户数据;

(3)进行数据清洗和预处理,根据用户宽表数据,对进行缺失值检测和异常值检查;

(4)进行数据采样,采用加入伪标签的方法,即已经被预测为涉诈用户且没有复机的号卡作为正样本加入被通报的号卡,使得正负样本的比例控制在1:15;

(5)基于机器学习算法训练模型,预测用户是电信诈骗用户的概率,同时利用交叉验证和网格搜索来寻找模型的最优参数;

(6)进行模型的迭代与优化;根据投诉用户、复机用户、接入用户优化模型,实现达到更好的预测效果。

2.根据权利要求1所述的一种基于机器学习的电信反欺诈方法,其特征在于:所述步骤(1)的通报号码分析具体为:根据公安和12321下发的通报号码核查分析,从用户的入网情况,套餐消费,历史活跃行为,上网行为,通话指标及位置信息入手分析正常用户与涉诈用户存在的区别,刻画出目标用户的特征。

3.根据权利要求1所述的一种基于机器学习的电信反欺诈方法,其特征在于:所述步骤(3)的数据清洗和预处理具体为:数据中的用户年龄,月出账信息,用户粘性采用中值填充,用户出账,省内外流量使用,语音通话次数、语音通话时长分别采用零值填充,针对异常值,用平均值来修正;针对数据中出现的数值,类型,日期等错误问题进行修正;针对缺失值,如年龄的缺失采用中位数填充,如月消费金额则进行零值的填充;在预处理中,针对一些类别变量,如用户的终端型号,用户的套餐名称,则进行独热编码的处理,将原本的中文类别转为计算机可处理的数字信息。

4.根据权利要求1所述的一种基于机器学习的电信反欺诈方法,其特征在于:所述步骤(4)数据采样时利用SMOTE算法,SMOTE算法是利用线性插值的方法计算两个新近通报号码样本,生成新的人工正样本加入到总体的正向样本中扩充正样本的数量;即运用公式:

Xnew,attr=Xi,attr+(Xij,attr-Xi,attr)×γ

Xij是样本Xi的j个邻近的样本,即表示涉诈样本i的邻近的j个涉诈样本;γ则是0到1之间的随机数;新生成的涉诈样本则用Xi和其邻近样本j的线性表达式组成。

5.根据权利要求4所述的一种基于机器学习的电信反欺诈方法,其特征在于:所述使用伪标签时,首先根据已打标的正负样本数据训练模型,再预测无标签数据;伪标签将训练集抽取一部分作为新的验证集,将预测出来的数据加入成为新的训练集,再训练出新的模型,从而预测后续的无标签数据;其中在反欺诈实际应用场景有以下一类用户数据:用户号卡被反欺诈模型预测命中关停,且长时间没有通过提供的线上、线下任何复机渠道来进行复机操作,则此类用户会被认定为存在涉诈风险的用户,将其当作伪标签数据加入到正样本中,扩充正样本;在本步骤中,伪标签是利用算法模型预测出来的涉诈非涉诈标签数据,和通报号码组成新的训练集,训练出最优模型,预测用户是否有涉诈风险。

6.根据权利要求1所述的一种基于机器学习的电信反欺诈方法,其特征在于:所述步骤(5)中的机器学习算法采用LightGBM算法,将获得的数据划分为训练集和测试集,训练集和测试集的比例为3:7;并采用5折交差验证法和网格搜索来筛选出模型的最优解,已达到最佳的评价指标;模型评估方面,主要采用F1值和AUC值来评估模型的效果,其中模型再测试集的F1值为0.871824,AUC值为0.995512。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江鸿程计算机系统有限公司,未经浙江鸿程计算机系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210034458.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top