[发明专利]一种利用k均值聚类算法识别就业地的方法在审
申请号: | 202110255241.0 | 申请日: | 2021-03-08 |
公开(公告)号: | CN112966750A | 公开(公告)日: | 2021-06-15 |
发明(设计)人: | 吴晓;胡明星;邵云通;张瑞琪;何彦 | 申请(专利权)人: | 东南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京同辉知识产权代理事务所(普通合伙) 11357 | 代理人: | 张明利 |
地址: | 210096 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 均值 算法 识别 就业 方法 | ||
本发明公开了一种利用k均值聚类算法识别就业地的方法,属于城市就业地研究领域。本发明以手机基站形成的泰森多边形作为待识别单元;对任一待识别单元两个工作日内的进出活动发生时间点进行数据统计;通过对用户每条手机信令数据记录的基站位置信息和前后记录的基站位置信息进行比较,来判断用户行为。之后统计各待识别单元所有用户的最晚离开时间节点、最早进入时间节点、停留时间长度,并利用K均值聚类法分析各待识别单元的质心分布规律,通过满足停留时间长度阈值的质心数量、停留时间长度的正负方向,以及各质心进出时间的重叠/间隔区间来共同判断待识别单元是否为就业地及其类型。
技术领域
本发明涉及城市就业地研究领域,具体涉及一种利用k均值聚类算法识别就业地的方法。
背景技术
就业地是城市居民参与生产活动而构成的固定空间范围——时间上,在就业地参与生产活动的时间具有规律性,通常呈现白天人多,晚上人少的特征;地点固定性,是居民参与生产活动频繁使用的空间。因此,根据上述特征,本研究探讨的就业地是指城市居民参与生产活动的地理位置。
传统的就业地识别思路主要依赖于用户白天数据的规律性,即通过用户白天在一个周期内不同时间节点出现在同一基站的次数累加起来判断是否为就业地,有一定的可操作性和合理性。
目前,上述识别方法最大的问题是:首先,识别时间主要依赖单时段(白天)用户的基站移动情况,而很可能将上夜班、两班倒和三班倒(如医院和工厂等特定的企事业单元)的实际就业地忽略,甚是误判为用户居住地;其次,该方法从用户个体行为数据角度直接判断其就业地,预先假设了用户“白天上班,晚上居家”的行为模式,忽略了用户除就业以外的出行,缺少在微观空间单元内对大量用户数据进行统计分析以准确判断该微观空间单元是否为就业地。
发明内容
针对现有技术的不足,本发明提出了一种利用k均值聚类算法识别就业地的方法,通过同步采纳和分析手机用户的白天和夜间的大数据进行“整日识别”,能够精准识别其居住地与就业地,避免了传统方法的疏漏;在以基站作为空间单元的基础上,以用户行为模式作为样本进行聚类分析,能够准确的判断各空间单元中占主导的人群活动方式,并进一步判断就业者的实际就业模式和空间单元的就业/居住类型。本发明的目的可以通过以下技术方案实现:
一种利用k均值聚类算法识别就业地的方法,包括以下步骤:
根据区域内目标基站的经纬度信息数据生成泰森多边形,并以泰森多边形作为待识别单元;
根据区域内的两个相邻工作日的手机信令数据进行清洗并统计所有用户进入和离开所述待识别单元行为发生的时间节点;
将所有用户的最晚离开时间节点减去对应用户的最早进入时间节点获取用户的停留时间长度;
采用k均值聚类算法对所述用户最晚离开时间节点、所述用户最早进入时间节点和所述用户的停留时间长度进行聚类分析获取质心,并根据所述质心计算所述质心之间进出时间点重叠/间隔区间;
根据满足所述停留时间长度阈值的质心数量、所述停留时间长度的正负方向和所述进出时间点重叠/间隔区间判断所述待识别单元是否为就业地及就业地种类。
进一步地,所述最晚离开时间节点的选取包含以下步骤:
若用户满足在第一天工作日存在离开所述待识别单元的记录,则选取所述第一天工作日的最晚离开时间节点为所述最晚离开时间节点;
若用户不满足在第一天工作日存在离开所述待识别单元的记录,则选取所述第二天工作日的最晚离开时间节点为所述最晚离开时间节点。
在用户第二天0点前无离开行动记录的前提下,取第二天24点前最晚离开时间节点,目的在于同时统计当日进出与隔日进出两种行动模式中的最晚离开时间节点。居民进出居住地多为当日进出,因此其最晚离开时间-最早进入时间<0;而夜班工作人员进出夜班就业地多为隔日进出,其最晚离开时间-最早进入时间>0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110255241.0/2.html,转载请声明来源钻瓜专利网。