[发明专利]一种基于话单数据的潜在社会关系网络的挖掘方法有效
申请号: | 201710657030.3 | 申请日: | 2017-08-03 |
公开(公告)号: | CN107423434B | 公开(公告)日: | 2020-02-18 |
发明(设计)人: | 宋航成 | 申请(专利权)人: | 航天科工智慧产业发展有限公司 |
主分类号: | H04M3/22 | 分类号: | H04M3/22;H04M3/42;G06F16/215 |
代理公司: | 北京市盛峰律师事务所 11337 | 代理人: | 梁艳 |
地址: | 100854 北京市西城区高粱桥*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 潜在 社会关系 网络 挖掘 方法 | ||
1.一种基于话单数据的潜在社会关系网络的挖掘方法,其特征在于,包括如下步骤:
S1,根据预先配置好的数据抽取规则从各大运营商抽取话单数据;
S2,根据预先配置好的数据清洗规则对抽取的话单数据进行清洗;
S3,根据预先配置好的数据转换规则将清洗后的数据统一转换成系统内标准话单数据,屏蔽不同运营商多种话单数据格式带来的复杂性,得到结构化的话单数据;
S4,根据结构化的话单数据构建多层次的动态社会关系网络;
S5,统计、汇总每个号码每天的结构化话单数据总结机主的通话规律;
S6,根据得到的机主的通话规律,分析通话异常时间区间内社会关系网络的变化情况;
S7,根据通话规律和通话异常分析结果,进行一人多号情况的分析;
S8,根据通话规律、通话异常分析结果、一人多号情况的分析结果以及动态社会关系网络挖掘潜在社会关系网络;
其中,S1-S4与S5-S7两部分之间的顺序可以互换。
2.根据权利要求1所述的基于话单数据的潜在社会关系网络的挖掘方法,其特征在于,所述数据抽取规则包括:数据抽取周期和需要抽取的话单数据元数据,所述元数据包括:话单处理时间、呼叫类型、IMSI、手机号码、对方号码、通话开始日期、通话开始时间、通话结束日期、通话结束时间、通话时长、通话计费、动态漫游、交换机号、LAC、CELLID、对端LAC、对端CELLID、基站号、基站LON、基站LAT和/或基站地址。
3.根据权利要求1所述的基于话单数据的潜在社会关系网络的挖掘方法,其特征在于,所述数据清洗规则包括:无效数据的特征规则和特殊数据的特征规则;其中,所述无效数据是指不包括如下任意一种数据的通话记录:呼叫类型、手机号码、对方号码、IMSI、通话开始日期、通话开始时间、通话结束日期、通话解释时间、基站号、基站LAT、基站LON以及基站地址,所述无效数据的特征规则为对于所述无效数据在数据清洗时系统自动清理掉;所述特殊数据的特征规则为在数据清洗时忽略所有特殊号码的通话记录数据。
4.根据权利要求1所述的基于话单数据的潜在社会关系网络的挖掘方法,其特征在于,所述数据转换规则包括原数据与系统内标准话单数据的对应关系;
其中,所述系统内标准话单数据的字段包括:话单处理时间、呼叫类型、IMSI、手机号码、对方号码、通话开始日期、通话开始时间、通话结束日期、通话结束时间、通话时长、通话计费、动态漫游、交换机号、LAC、CELLID、对端LAC、对端CELLID、基站号、基站LON、基站LAT和基站地址。
5.根据权利要求1所述的基于话单数据的潜在社会关系网络的挖掘方法,其特征在于,假设T1、T2、T3、T4为时间节点,并且T1<T2<T3<T4;
B为机主,Nb1和Nb2为B对应的社会关系网络;Mb为B的已知手机号,节点Nb1Di(其中i=1、2、3、…….)属于网络Nb1,节点Nb2Dj(其中j=1、2、3、…….)属于网络Nb2;
则S7中,所述一人多号情况的分析,具体为:
根据机主B的通话规律分析结果,如果在时间区间[T1,T2],Mb与社会关系网络中任意一个节点都没有任何通话记录,在时间区间[T2,T3],有另外一个号码Mx与Nb1或Nb2网络中某些节点有通信记录,然后号码Mx在时间区间[T3,T4]或者[T3,∞)内再没有与Nb1或Nb2网络中任何节点有过通话记录,同时在时间区间[T3,∞),Mb恢复正常通话规律,则可以初步判定机主B同时拥有Mb和Mx两个号码或者Mx的机主与机主B是同伙;
或
通过多话单数据基站位置数据分析,绘制手机Mb的移动轨迹,如果在一个时间区间,总有一个新号码Mx的位置与Mb轨迹类似,则可以初步认定号码Mx与Mb同时归机主B拥有或者Mx的机主与B是同伙。
6.根据权利要求1所述的基于话单数据的潜在社会关系网络的挖掘方法,其特征在于,S4具体为:
根据结构化的话单数据,以通话频率和通话时长为边,以电话号码为节点构建多层次动态社会关系网;所述社会关系网络随着时间推移动态变化更新。
7.根据权利要求1所述的基于话单数据的潜在社会关系网络的挖掘方法,其特征在于,S8具体为:
机主B的关系网络Nb1的节点Nb1Di与Nb2的节点Nb2Dj,如果在不超过六个节点的情况下,拥有一个共同的节点,则初步认定Nb1Di与Nb2Dj是认识的,由Nb1Di与Nb2Dj组成新的社会关系网络;
或
通过一人多号分析得到新号码,对所有的新号码形成的社会关系网络节点进行聚类分析,得到新的社会关系网络;
或
根据当日不同时间段的通话对象、通话时间、通话时长和通话频率,构建社会关系网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天科工智慧产业发展有限公司,未经航天科工智慧产业发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710657030.3/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置