[发明专利]一种基于多数据源的社区人口信息关联的方法有效
申请号: | 201811493200.X | 申请日: | 2018-12-07 |
公开(公告)号: | CN109635003B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 石屹;王玉玉;耿俊伟;徐慧;郭欣 | 申请(专利权)人: | 南京华苏科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06Q50/26;H04W24/08 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 王素琴 |
地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多数 社区 人口 信息 关联 方法 | ||
1.一种基于多数据源的社区人口信息关联的方法,其特征在于,包括以下步骤:
(1)设备部署:基于小区场景的布点和楼栋场景的布点原则进行设备部署;
(2)数据采集:通过有线或无线方式连接步骤(1)中的所述设备,进行小区内实体数据的采集;
(3)数据处理:基于分布式架构的集群进行数据的处理;
(4)数据关联分析:基于已采集的数据内容,运用关联算法模型,基于时空维度进行数据分析和关联,输出一一对应的关联关系;
(5)应用分析:基于关联的数据进行可视化应用分析,并对异常状态进行预警;
所述步骤(1)中的设备包括WIFI热点或/和微侦码或/和摄像头;所述步骤(1)的设备部署中具体包括以下步骤:
S11基于小区场景的布点:于车辆出入口附近部署WIFI热点、微侦码和摄像头;
S21基于楼栋场景的布点:位于识别的楼栋周边部署WIFI热点,运用WIFI热点覆盖重叠方式,取其WIFI热点设备重叠覆盖交叉的人口信息;同时位于单元楼出入口安装摄像头采集单元楼住户图像;
所述步骤(4)数据关联分析中已采集的数据内容主要包含用户的MAC地址、IMSI、车牌号、人脸图像;
所述步骤(4)中的关联算法具体包括:
S41信息整合:根据时间,将多种设备采集的信息整合到一个列表中,其中每一行代表在同一时间点、同一地点的多种设备采集到的所有信息,采用IMSI和MAC地址时如下式所示:
L=Lt1+s1={{IMSI1,IMSI2,IMSI3,MAC1,MAC2,MAC3,MAC4,MAC5,MAC6},
{IMSI4,IMSI5,IMSI6,MAC4,MAC5,MAC6},
{IMSI1,IMSI2,IMSI3,MAC1,MAC2,MAC3}};
S42挖掘频繁项集:包括生成一阶频繁项集和挖掘二阶频繁项集,采用IMSI号与MAC地址的匹配时,频繁项就是在庞大的数据集中,统计那些同时同地出现的IMSI号与MAC的频次,若频次大于最小频次,则视以该IMSI号与MAC组成的集合为频繁项集;
S421生成一阶频繁项集:
利用FP-growth算法生成一阶频繁项集,具体方法步骤如下:
S421-1:输入S41中信息整合后的列表L和最小频次S,满足最小频次S的项集则为频繁项集;
S421-2:对列表L进行一次扫描、过滤和排序;
S421-3:对经过S421-2处理后的L1构建FP树用来挖掘IMSI、MAC的二阶频繁项集;
S422挖掘二阶频繁项集:
S422-1:从S421-3构建的FP树获得关于IMSI和MAC的条件模式基;
S422-2:利用条件模式基构建属于IMSI和MAC的条件FP树;
S422-3:在条件FP树中按照最小频次过滤挖掘出二阶频繁项集;
S43生成关联规则:在步骤S42挖掘频繁项的过程中,会出现许多一对多,多对多的匹配结果,无法得到唯一的匹配结果;针对该现象,依据Apriori算法中支持度和置信度的计算原理计算出关联规则的支持度和置信度,最后通过置信度筛选来找出最终唯一的匹配结果,生成关联规则具体步骤如下:
S431计算支持度:一个项集出现的次数与数据集所有事物数的百分比称为项集的支持度;支持度反映了项集出现的概率,关联规则的支持度等于频繁集的支持度;采用IMSI号和MAC地址时:
其中,公式(1)得到该IMSI号在整个项集中出现的概率,公式(2)得到该MAC地址在整个项集中出现的概率,公式(3)得到该IMSI号和MAC地址在整个项集中同时出现的概率;
S432计算置信度:计算置信度即计算频繁项集中,某一个元素产生的条件下,产生另一个元素的概率,即条件概率;或某一个元素可推导出另外一个元素的概率,采用IMSI号与MAC地址时:
其中,公式(4)得到IMSI推导出MAC的概率,公式(5)得到MAC推导出IMSI的概率;
最后设置一个最小置信度,保留所有满足最小置信度的关联规则;
S433置信度筛选:对步骤S432得到的关联规则及其置信度根据一定规则进一步筛选匹配结果;
S433-1:对一对多匹配设置初步筛选条件,过滤掉单向匹配的结果,仅保留含有双向匹配的结果;
S433-2:将S433-1中双向匹配的结果相加;
S433-3:将S433-2结果以IMSI为关键字分组继续过滤;
S433-4:对S433-3剩余的每个分组进行置信度对比筛选,选择置信度高的匹配;
S433-5:将S433-4处理后的数据再以MAC为关键字分组继续过滤;
S433-6:对S433-5剩余的每个分组进行置信度对比筛选,选择置信度高的匹配结果即为最终结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京华苏科技有限公司,未经南京华苏科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811493200.X/1.html,转载请声明来源钻瓜专利网。