[发明专利]基于CDR话单的用户群体划分方法和系统有效
| 申请号: | 201510020953.9 | 申请日: | 2015-01-15 |
| 公开(公告)号: | CN104573034B | 公开(公告)日: | 2018-03-23 |
| 发明(设计)人: | 罗云彬;李浩 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京安信方达知识产权代理有限公司11262 | 代理人: | 白莹,栗若木 |
| 地址: | 100033 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 cdr 用户 群体 划分 方法 系统 | ||
1.一种基于呼叫详细揭露CDR话单的用户群体划分方法,包括:
S101、周期性获取预定时间段中的CDR话单,根据所获取的CDR话单中的记录提取出每个用户的联络数据,包括:该用户作为主叫/被叫用户时的通话次数、通话对象、通话时长,以及该用户收、发短信的次数及对象;
S102、分别根据各用户的联络数据,计算该用户和该用户的各相关用户之间的热度值,所述相关用户为与该用户存在通话或短信的用户;
S103、根据所述热度值确定热点中心用户;
S104、分别在各热点中心用户的相关用户中剔除仅与该热点中心用户存在通话或短信的用户;将各热点中心用户及其剔除后剩余的相关用户各自划分为一个用户群体;
所述分别在各热点中心用户的相关用户中剔除仅与该热点中心用户存在通话或短信的用户包括:
对于各热点中心用户分别进行下述操作:
将该热点中心用户及其相关用户各作为网络结构图中的一个点,如果任意两个用户之间存在通话或短信,则在两个点之间增加连线;
在所述网络结构图中以热点中心用户作为起始点向各相关用户出发,再依次从所述各相关用户出发,不经过重复的点和线返回所述热点中心用户;如果不能够回到热点中心用户,则将出发时的相关用户剔除。
2.如权利要求1所述的方法,其特征在于,用户m与用户n之间的所述热度值H(m-n)为:
其中,ps(m-n)指用户m作为主叫呼叫用户n的通话次数;ps(n-m)是指用户m作为被叫用户与用户n通话次数;ms(m-n)指用户m作为主动短信发起方向用户n发送短信次数;ms(n-m)指用户m作为被动短信发起方与用户n发送短信次数;pt(m-n)i指用户m作为主叫与用户n单次通话时长超过120s的部分,单位为秒,S1为用户m作为主叫与用户n单次通话时长超过120秒的次数;pt(n-m)j指用户m作为被叫与用户n单次通话时长超过120秒的部分,单位为秒,S2为用户m作为被叫与用户n单次通话时长超过120s的次数;为向上取整。
3.如权利要求1所述的方法,其特征在于,所述步骤S103包括:
对于各用户分别求出热度值总和,包括:将该用户和该用户的各相关用户之间的热度值累加,累加结果为所述热度值总和;
将热度值的总和高于预定热度值阈值的用户作为候选用户;
对每两个各候选用户分别进行下述筛选操作:比较两个候选用户的相关用户,统计重叠的相关用户的数量N1;对于所述两个候选用户分别计算所述数量N1与本候选用户的相关用户总数量的百分比;如果其中一个候选用户的百分比超过预定比例阈值,则剔除该候选用户;如果两个百分比都超过预定比例阈值,则剔除热度值总和较低的候选用户;
将筛选操作后剩下的候选用户作为所述热点中心用户。
4.如权利要求1所述的方法,其特征在于,步骤S104包括:
51、在每个Storm节点上装载热点中心用户和其相关用户,按照热点中心用户的热度值总和进行顺序装载;第一个Storm节点进行步骤52;
52、对本Storm节点上所有的相关用户进行遍历,剔除仅与该热点中心用户存在通话或短信的相关用户;剔除后如果有下一个Storm节点则将该用户群体信息通过Storm节点的socket接口发送到下一个Storm节点后进行步骤53,没有下一个节点则进行步骤54;所述用户群体信息中包括当前节点上剩余的用户的标识;
53、所述下一个Storm节点根据所述用户群体信息剔除本节点上重复的用户后进行步骤52;
54、每个Storm节点上的用户各为一个划分出的用户群体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510020953.9/1.html,转载请声明来源钻瓜专利网。





