[发明专利]一种数据挖掘方法、装置、电子设备及存储介质在审
申请号: | 201911072865.8 | 申请日: | 2019-11-05 |
公开(公告)号: | CN110825785A | 公开(公告)日: | 2020-02-21 |
发明(设计)人: | 翁宗鹏;丁保剑;秦伟;曾明;李逸帆;杨东泉 | 申请(专利权)人: | 佳都新太科技股份有限公司;广州佳都科技软件开发有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06Q50/26 |
代理公司: | 北京权智天下知识产权代理事务所(普通合伙) 11638 | 代理人: | 王新爱 |
地址: | 511400 广东省广州市番禺区东环街迎宾*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 挖掘 方法 装置 电子设备 存储 介质 | ||
1.一种数据挖掘方法,其特征在于,包括:
获取用于犯罪团伙挖掘的业务数据,将所述业务数据进行时间切片得到切片数据集,所述切片数据集的每一切片数据包含挖掘对象在对应切片时间下的经纬度信息和/或手机MAC地址信息;
提取犯罪嫌疑人在对应时间段的经纬度信息或手机MAC地址信息,与所述切片数据集进行比对,确定与犯罪嫌疑人的经纬度信息或手机MAC地址信息在同一切片时间下存在设定关联关系的第一挖掘对象集合;
从所述第一挖掘对象集合中确定与犯罪嫌疑人为同伙关系的挖掘对象。
2.根据权利要求1所述的数据挖掘方法,其特征在于,所述提取犯罪嫌疑人在对应时间段的经纬度信息或手机MAC地址信息,与所述切片数据集进行比对,确定与犯罪嫌疑人的经纬度信息或手机MAC地址信息在同一切片时间下存在设定关联关系的第一挖掘对象集合,包括:
提取犯罪嫌疑人在对应时间段的经纬度信息;
将所述切片数据集中包含经纬度信息的切片数据与犯罪嫌疑人在对应时间段的经纬度信息进行比对,确定同一切片时间下对应犯罪嫌疑人和相应挖掘对象的两个经纬度信息;
计算所述两个经纬度信息的余弦相似度,提取余弦相似度达到设定相似度阈值的对应挖掘对象,形成第一挖掘对象集合。
3.根据权利要求1所述的数据挖掘方法,其特征在于,所述提取犯罪嫌疑人在对应时间段的经纬度信息或手机MAC地址信息,与所述切片数据集进行比对,确定与犯罪嫌疑人的经纬度信息或手机MAC地址信息在同一切片时间下存在设定关联关系的第一挖掘对象集合,包括:
提取犯罪嫌疑人在对应时间段的手机MAC地址信息;
将所述切片数据集中包含手机MAC地址信息的切片数据与犯罪嫌疑人在对应时间段的手机MAC地址信息进行比对,根据WiFi连接数据确定连接同一WiFi的对应犯罪嫌疑人和相应挖掘对象的两个手机MAC地址信息;
计算所述两个手机MAC地址信息接入同一WiFi的时间离散度,提取时间离散度达到设定指标的对应挖掘对象,形成第一挖掘对象集合。
4.根据权利要求1所述的数据挖掘方法,其特征在于,所述经纬度信息根据WiFi连接数据、网吧登录数据、酒店入住数据或终端身份认证定位数据获取,所述手机MAC地址信息通过WiFi连接数据获取。
5.根据权利要求4所述的数据挖掘方法,其特征在于,所述WiFi连接数据包含有WiFi发射器的经纬度数据及WiFi发射器获取到的手机MAC地址,通过所述WiFi发射器获取到的手机MAC地址确定对应挖掘对象的所述手机MAC地址信息,并在挖掘对象的手机连接对应WiFi热点时,以所述WiFi发射器的经纬度数据作为对应挖掘对象的所述经纬度信息。
6.根据权利要求4所述的数据挖掘方法,其特征在于,所述从所述第一挖掘对象集合中确定与犯罪嫌疑人为同伙关系的挖掘对象,包括:
根据网吧登录数据、酒店入住数据和终端身份认证定位数据确定与犯罪嫌疑人存在设定关联关系的第二挖掘对象集合;
将所述第一挖掘对象集合与所述第二挖掘对象集合进行并集,确定与犯罪嫌疑人为同伙关系的挖掘对象。
7.根据权利要求6所述的数据挖掘方法,其特征在于,所述根据网吧登录数据、酒店入住数据和终端身份认证定位数据确定与犯罪嫌疑人存在设定关联关系的第二挖掘对象集合,包括:
根据网吧登录数据提取与犯罪嫌疑人在同一网吧、同一切片时间下录入身份认证信息达到设定次数的对应挖掘对象,形成第一候选列表;
根据酒店入住数据提取与犯罪嫌疑人在同一酒店、同一切片时间下录入身份认证信息达到设定次数的对应挖掘对象,形成第二候选列表;
根据终端身份认证定位数据确定与犯罪嫌疑人在同一地点、同一切片时间下接入同一WiFi热点达到设定次数的对应挖掘对象,通过手机MAC地址录入身份认证信息确定对应挖掘对象的身份信息,形成第三候选列表;
将所述第一候选列表、所述第二候选列表和所述第三候选列表通过交集处理得到第二挖掘对象集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳都新太科技股份有限公司;广州佳都科技软件开发有限公司,未经佳都新太科技股份有限公司;广州佳都科技软件开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911072865.8/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置