[发明专利]基于谱聚类的外来常住人口识别方法在审
申请号: | 201710579128.1 | 申请日: | 2017-07-17 |
公开(公告)号: | CN107358265A | 公开(公告)日: | 2017-11-17 |
发明(设计)人: | 徐珊珊;唐大鹏 | 申请(专利权)人: | 南京华苏科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/26 |
代理公司: | 江苏纵联律师事务所32253 | 代理人: | 戴勇 |
地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 谱聚类 外来 常住人口 识别 方法 | ||
技术领域
本发明属于通信技术领域,尤其是涉及一种基于谱聚类的外来常住人口识别方法。
背景技术
随着经济体制改革的推进,城市中外来常住人口迅速扩大,成为了一个不可忽视的特殊群体。常住人口,作为一种统计口径,主要针对地区而言,常住人口与户籍人口的统计口径不同,在社会与政府部门工作中发挥着不同的作用。在当前流动人口规模大、人户分离现象较为普遍的情况下,常住人口更能准确地反应一个地区的人口规模与现状,对于政府制定相关政策与服务措施提供更为有效的信息。所以统计外来常住人口数量对于了解国情国力,制定人口计划和经济、社会发展计划,进行人口科学研究,都有十分重要的意义。
但人口统计一直是一项费时费力的工作。现有的外来常住人口识别方法中,主要靠人工来完成,通过发放问卷的方式或者电话外呼的方式来确认,这种方法不但耗费人力物力,而且效率低下。部分运营商也会采取口径的方式进行定义,但此种定义规则缺乏科学解释性。如何减少人力物力,采用更高效科学的手段对外来常住人口进行识别是一项具有挑战的工作。
发明内容
本发明要解决的问题是提供一种根据移动手机用户驻留数据,使用大数据手段对外来常住人口进行统计的基于谱聚类的外来常住人口识别方法。
为解决上述技术方案,本发明采用的技术方案是:该基于谱聚类的外来常住人口识别方法,其特征在于,包括以下步骤:
步骤(1):收集手机用户驻留数据信息;
步骤(2):针对所述步骤(1)中的创建若干个用户驻留行为特征变量;
步骤(3):对所述步骤(2)中的变量进行变量筛选,并进行无量纲化处理;
步骤(4):采用谱聚类方法进行聚类分析,建立模型;
其中,所述步骤(1)中的驻留数据信息包括驻留天数、驻留时长以及ECI切换数据。
在外来人口的定义上,根据运营商的要求对外来人口做出如下定义,手机号码归属地和身份证信息共分为如图1所示四种用户类型,第一类为本地号码本地户籍的用户,第二类为本地号码外地户籍本地户口的用户,第三类为本地号码外地户籍外地户口的用户,第四类为外地号码的用户。其中,第一类和第二类人均不归类为外来人口,所以常住外来人口识别只需针对第三类和第四类用户进行分析。
移动运营商所收集的用户驻留信息可以统计用户在本市的驻留天数、驻留时长以及ECI切换数据。其中,常住和非常住用户在驻留特征上一定不同,因此通过对驻留信息进行处理形成驻留特征变量,则可使用聚类算法对两类用户进行区分;上述技术方案根据移动手机用户驻留数据,使用大数据手段对外来常住人口进行统计,从而为政府提供具有科学解释性的数据支撑,既不用像传统普查方式那样费时费力,也让识别结果更具科学性。
优选的,在所述步骤(1)中,手机用户包括本地号码外地户籍外地户口的用户和外地号码的用户。
优选的,在所述步骤(2)中,创建若干个用户驻留行为特征变量包括有:
v1:统计各用户一个月中驻留的天数总和;
v2:统计各用户一个月中驻留的小时数总和;
v3:统计各用户一个月中驻留的秒数总和;
v4:统计各用户工作日eci类别总数,只统计驻留超过十分钟的eci;
v5:统计各用户休息日eci类别总数,只统计驻留超过十分钟的eci;
v6:统计各用户工作日eci总和;
v7:统计各用户休息日eci总和;
v8:统计各用户工作日驻留的天数总和;
v9:统计各用户休息日驻留的天数总和;
v10:统计各用户工作日驻留的小时数总和;
v11:统计各用户休息日驻留的小时数总和;
v12:统计各用户工作日驻留秒数总和;
v13:统计各用户休息日驻留秒数总和;
v14:统计各用户平均每天驻留时长,按小时统计;
v15:统计各用户平均每天驻留时长,按秒统计。
为了保护客户隐私,运营商只能提供用户驻留数据,未经处理的驻留数据无法用于用户聚类分析,因此要对驻留数据进行变形转换,运用统计手段处理产生新的可用变量。
优选的,在所述步骤(3)中,采用Pearson相关系数来衡量变量之间的相关关系,其计算公式如下:
其中,变量X是所有点的x坐标的集合;变量Y是所有点的y坐标的集合;N表示点的总个数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京华苏科技有限公司,未经南京华苏科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710579128.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多重过滤人工湿地
- 下一篇:一种高效人工湿地