[发明专利]一种国际盗打实时检测方法有效
申请号: | 202011517575.2 | 申请日: | 2020-12-21 |
公开(公告)号: | CN112738806B | 公开(公告)日: | 2023-05-09 |
发明(设计)人: | 周剑明;林俊德;陈立峰;林诚汉;董晓伟;蒋淋兵;王芯怡 | 申请(专利权)人: | 福建新大陆软件工程有限公司 |
主分类号: | H04W12/121 | 分类号: | H04W12/121;H04W12/122;H04W12/128;G06F18/214;G06F18/2431 |
代理公司: | 福州市京华专利代理事务所(普通合伙) 35212 | 代理人: | 范小清 |
地址: | 350000 福建省福州*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 国际 实时 检测 方法 | ||
1.一种国际盗打实时检测方法,其特征在于:包括如下步骤:
步骤S10、从国际通话数据库中获取历史CDR通话数据;
步骤S20、对所述历史CDR通话数据进行预处理,得到通话预处理数据;
步骤S30、对所述通话预处理数据进行特征提取,得到通话特征数据;
步骤S40、基于梯度提升决策树算法创建一盗打检测模型,利用所述通话特征数据对盗打检测模型进行训练;
步骤S50、获取实时CDR通话数据,将所述实时CDR通话数据经特征提取后输入训练后的盗打检测模型进行国际盗打的实时检测;
所述步骤S40具体包括:
步骤S41、基于梯度提升决策树算法创建一盗打检测模型,对所述通话特征数据进行国际盗打话单和非国际盗打话单的标记;
步骤S42、设定一第一比例、一第二比例以及一比例阈值,基于所述第一比例将标记后的通话特征数据划分为训练集以及检测集;所述第一比例为8:2;所述第二比例为1:3;
所述训练集以及检测集中国际盗打话单和非国际盗打话单的比例为第一比例;
步骤S43、利用SMOTE算法对所述训练集以及检测集中的国际盗打话单进行样本扩充,使得所述国际盗打话单与非国际盗打话单的比例达到第二比例;
步骤S44、将所述训练集均分为5个子集,轮流选取其中1个子集作为验证集,选取其他4个子集作为训练子集,利用所述训练子集对盗打检测模型进行训练;
所述盗打检测模型训练的过程中,利用超参数优化器对所述盗打检测模型的超参数进行优化;所述超参数至少包括迭代次数以及梯度提升决策树的深度;
步骤S45、利用所述验证集对盗打检测模型进行验证,计算5次盗打预测召回率的平均值,判断所述平均值是否大于比例阈值,若是,则进入步骤S46;若否,则增加所述通话特征数据的样本量,并进入步骤S42;
步骤S46、利用所述检测集对盗打检测模型进行验证,计算盗打预测召回率是否大于所述比例阈值,若是,完成所述盗打检测模型的训练,进入步骤S50;若否,则增加所述通话特征数据的样本量,并进入步骤S42。
2.如权利要求1所述的一种国际盗打实时检测方法,其特征在于:所述步骤S10中,所述历史CDR通话数据包括主叫号码、被叫号码、呼叫开始日期、呼叫结束日期、呼叫开始时间以及呼叫结束时间。
3.如权利要求1所述的一种国际盗打实时检测方法,其特征在于:所述步骤S20具体为:
对所述历史CDR通话数据进行过滤重复项以及过滤缺失项的预处理,得到通话预处理数据。
4.如权利要求3所述的一种国际盗打实时检测方法,其特征在于:所述过滤重复项的预处理具体为:
对所述历史CDR通话数据中,主叫号码、被叫号码、呼叫开始日期、呼叫结束日期、呼叫开始时间以及呼叫结束时间完全一致的话单进行重复项删除。
5.如权利要求3所述的一种国际盗打实时检测方法,其特征在于:所述过滤缺失项的预处理具体为:
对所述历史CDR通话数据中,主叫号码、被叫号码、呼叫开始日期、呼叫结束日期、呼叫开始时间以及呼叫结束时间存在任一字段缺失的话单进行删除。
6.如权利要求1所述的一种国际盗打实时检测方法,其特征在于:所述步骤S30具体为:
计算所述通话预处理数据中,各主叫号码的通话范围、通话次数、通话时长以及呼叫间隔,作为通话特征数据;
所述通话范围包括每分钟通话范围平均值、每分钟通话范围最大值、每小时通话范围平均值、每小时通话范围最大值、每时间段通话范围平均值、每时间段通话范围最大值;所述通话次数包括每分钟通话次数平均值、每分钟通话次数最大值、每小时通话次数平均值、每小时通话次数最大值、每时间段通话次数平均值、每时间段通话次数最大值;所述通话时长包括每分钟通话时长平均值、每分钟通话时长最大值、每小时通话时长平均值、每小时通话时长最大值、每时间段通话时长平均值、每时间段通话时长最大值;所述呼叫间隔包括每分钟呼叫间隔平均值、每小时呼叫间隔平均值、每时间段呼叫间隔平均值。
7.如权利要求1所述的一种国际盗打实时检测方法,其特征在于:所述步骤S50具体为:
获取实时CDR通话数据,将所述实时CDR通话数据依次进行预处理以及特征提取后生成实时通话特征数据,输入训练后的盗打检测模型进行国际盗打的实时检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福建新大陆软件工程有限公司,未经福建新大陆软件工程有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011517575.2/1.html,转载请声明来源钻瓜专利网。