[发明专利]基于谱聚类的外来常住人口识别方法在审
申请号: | 201710579128.1 | 申请日: | 2017-07-17 |
公开(公告)号: | CN107358265A | 公开(公告)日: | 2017-11-17 |
发明(设计)人: | 徐珊珊;唐大鹏 | 申请(专利权)人: | 南京华苏科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/26 |
代理公司: | 江苏纵联律师事务所32253 | 代理人: | 戴勇 |
地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 谱聚类 外来 常住人口 识别 方法 | ||
1.一种基于谱聚类的外来常住人口识别方法,其特征在于,包括以下步骤:
步骤(1):收集手机用户驻留数据信息;
步骤(2):针对所述步骤(1)中的创建若干个用户驻留行为特征变量;
步骤(3):对所述步骤(2)中的变量进行变量筛选,并进行无量纲化处理;
步骤(4):采用谱聚类方法进行聚类分析,建立模型;
其中,所述步骤(1)中的驻留数据信息包括驻留天数、驻留时长以及ECI切换数据。
2.根据权利要求1所述的基于谱聚类的外来常住人口识别方法,其特征在于,在所述步骤(1)中,手机用户包括本地号码外地户籍外地户口的用户和外地号码的用户。
3.根据权利要求1所述的基于谱聚类的外来常住人口识别方法,其特征在于,
在所述步骤(2)中,创建若干个用户驻留行为特征变量包括有:
v1:统计各用户一个月中驻留的天数总和;
v2:统计各用户一个月中驻留的小时数总和;
v3:统计各用户一个月中驻留的秒数总和;
v4:统计各用户工作日eci类别总数,只统计驻留超过十分钟的eci;
v5:统计各用户休息日eci类别总数,只统计驻留超过十分钟的eci;
v6:统计各用户工作日eci总和;
v7:统计各用户休息日eci总和;
v8:统计各用户工作日驻留的天数总和;
v9:统计各用户休息日驻留的天数总和;
v10:统计各用户工作日驻留的小时数总和;
v11:统计各用户休息日驻留的小时数总和;
v12:统计各用户工作日驻留秒数总和;
v13:统计各用户休息日驻留秒数总和;
v14:统计各用户平均每天驻留时长,按小时统计;
v15:统计各用户平均每天驻留时长,按秒统计。
4.根据权利要求1所述的基于谱聚类的外来常住人口识别方法,其特征在于,在所述步骤(3)中,采用Pearson相关系数来衡量变量之间的相关关系,其计算公式如下:
其中,变量X是所有点的x坐标的集合;变量Y是所有点的y坐标的集合;N表示点的总个数;
根据各变量间的相关关系删除具有强相关的变量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京华苏科技有限公司,未经南京华苏科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710579128.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多重过滤人工湿地
- 下一篇:一种高效人工湿地