[发明专利]通信数据处理方法、装置及存储介质在审
申请号: | 201811320663.6 | 申请日: | 2018-11-07 |
公开(公告)号: | CN109492693A | 公开(公告)日: | 2019-03-19 |
发明(设计)人: | 李创创;卢光跃;吴洋 | 申请(专利权)人: | 西安邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q30/02 |
代理公司: | 北京旭路知识产权代理有限公司 11567 | 代理人: | 瞿卫军 |
地址: | 710000 陕西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 决策函数 样本 分类平面 通信数据处理 平移 存储介质 分类样本 目标分类 校正 分类 偏移问题 欠费用户 通信用户 移动步长 漏检率 漏检 预设 检测 预测 | ||
本发明是关于一种通信数据处理方法、装置及存储介质,通过初始分类平面和距离决策函数将待分类样本分为欠费样本和非欠费样本,之后,并按照预设的移动步长将初始分类平面向非欠费样本方向进行平移,校正初始分类平面的偏移问题,同时,根据平移后的初始分类平面确定当前距离决策函数,再根据当前距离决策函数确定目标分类决策函数,并根据目标分类决策函数对待分类样本的分类进行校正,从而使漏检的欠费样本进行重新分类,减少欠费样本的漏检率,提高欠费样本的检测精度,进而提高在通信用户中对欠费用户的预测精度。
技术领域
本发明涉及通信技术领域,尤其涉及通信数据处理方法、装置及存储介质。
背景技术
近年来,随着通信运营商之间的竞争日益激烈,我国电信运营商为提高竞争力,不断推出大量的新业务,但是,同时也降低了用户的开户门槛,使得拖欠、拒交话费用户的比例不断增加,对电信运营商正常运营造成很大影响。为了减少坏账、增加公司利润,越来越多的电信运营商通过建立用户欠费预测模型,提前预测可能出现欠费的用户,以便于对该类用户采取相应的措施。
在通信用户中,通常欠费用户的数量远远小于非欠费用户的数量,使得通信数据为不均衡数据,现有技术中,传统SVM(Support Vector Machine,支持向量机)分类算法在均衡数据集上可以得到良好的分类效果,但是,当数据集不均衡时,分类平面会偏向于少数类样本,即欠费用户,导致少数类样本的漏检率增大,以至于欠费用户预测的正确率较低。
发明内容
为克服相关技术中存在的问题,本发明提供一种通信数据处理方法、装置及存储介质。
根据本发明实施例的第一方面,提供一种通信数据处理方法,包括:获取通信用户的通信数据,并对所述通信数据进行预处理,得到待分类样本;根据预设分类模型将所述待分类样本映射到高维空间上,确定所述待分类样本的初始分类平面和距离决策函数,并根据所述初始分类平面和所述距离决策函数将所述待分类样本分为欠费样本和非欠费样本;按照预设的移动步长和平移次数将所述初始分类平面向所述非欠费样本方向进行平移,确定每次平移后的当前距离决策函数;根据所述当前距离决策函数确定目标分类决策函数,根据所述目标分类决策函数对所述待分类样本进行分类校正。
可选地,在所述根据预设分类模型将所述待分类样本映射到高维空间上,确定所述待分类样本的初始分类平面和距离决策函数中,所述预设分类模型包括CISVM基于置信度SVM集成算法,所述初始分类平面包括:
w·x+b=0
其中,x表示所述待分类样本的向量,w表示所述待分类样本对应的权重向量,b表示偏移向量;
根据所述初始分类平面确定所述距离决策函数,所述距离决策函数包括:
其中,αj表示约束系数,yj表示目标属性的向量,K(xi,xj)表示所述通信用户的待分类样本的向量函数。
可选地,在所述按照预设的移动步长和平移次数将所述初始分类平面向所述非欠费样本方向进行平移,确定每次平移后的当前距离决策函数中,所述当前距离决策函数包括:
其中,rm表示所述初始分类平面在第m次平移后的当前分类平面到所述初始分类平面的距离。
可选地,在所述根据所述当前距离决策函数确定目标分类决策函数中,所述目标分类决策函数包括:
其中,M为所述初始分类平面的平移次数。
根据本发明实施例的第二方面,提供一种通信数据处理装置,包括:预处理模块,获取通信用户的通信数据,并对所述通信数据进行预处理,得到待分类样本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安邮电大学,未经西安邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811320663.6/2.html,转载请声明来源钻瓜专利网。