[发明专利]一种基于社区活动轨迹的人员聚类方法及系统在审
申请号: | 202010975588.8 | 申请日: | 2020-09-16 |
公开(公告)号: | CN112241685A | 公开(公告)日: | 2021-01-19 |
发明(设计)人: | 邓雄 | 申请(专利权)人: | 四川天翼网络服务有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 成都金英专利代理事务所(普通合伙) 51218 | 代理人: | 袁英 |
地址: | 610041 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 社区活动 轨迹 人员 方法 系统 | ||
1.一种基于社区活动轨迹的人员聚类方法,其特征在于,所述人员聚类方法包括如下步骤:
采集社区区域范围内的人员进出记录;
根据人员的进出记录信息,统计人员的进出信息,包括:以小时为单位统计人员进出的次数及频率,以时段为单位统计人员进出的次数及频率;
根据人员的进出记录信息,将人员的个人信息进行文本特征处理为onehot编码;
将人员的进出信息和人员的个人信息输入K-means聚类分析算法,通过设置不同的类别数得到不同类别数量下的聚类损失函数值;
根据得到不同类别数量下的聚类损失函数值及类别数量拟合在当前数据集下的聚类损失对类别数的函数;
将该拟合函数的拐点作为最佳分类数量,以最佳分类数量对应的聚类模型将社区区域范围内的人员进行聚类。
2.如权利要求1所述的一种基于社区活动轨迹的人员聚类方法,其特征在于,所述统计人员的进出信息步骤中,以小时为单位统计人员进出的次数及频率具体为:根据人员的进出记录日期,统计人员进出的天数、次数、平均进出次数及频率,再计算出人员在各小时内进出的次数及频率。
3.如权利要求1所述的一种基于社区活动轨迹的人员聚类方法,其特征在于,所述统计人员的进出信息步骤中,以时段为单位统计人员进出的次数及频率具体为:将一个自然日分为多个时段,根据人员的进出记录时间,统计人员在每个时段的进出次数、频率。
4.如权利要求3所述的一种基于社区活动轨迹的人员聚类方法,其特征在于,所述多个时段根据每个自然日的时间分成凌晨、早晨、上午、下午、中午和晚上。
5.如权利要求1所述的一种基于社区活动轨迹的人员聚类方法,其特征在于,所述人员聚类方法还包括画像生成步骤:根据聚类模型将社区区域范围内的人员进行聚类的分析结果,为每一类人员生成进出信息,并根据采集人脸的画像信息,为人员进出信息匹配对应的个人信息和画像信息。
6.如权利要求1所述的一种基于社区活动轨迹的人员聚类方法,其特征在于,所述采集社区区域范围内的人员进出记录通过对社区大门出入数据库进行数据对接,将数据库中存储社区各门禁的流水数据进行采集调用。
7.一种基于社区活动轨迹的人员聚类系统,其特征在于,所述人员聚类系统包括:
活动轨迹采集单元:采集社区区域范围内的人员进出记录;
进出信息预处理单元:根据人员的进出记录信息,统计人员的进出信息,包括:以小时为单位统计人员进出的次数及频率,以时段为单位统计人员进出的次数及频率;
个人信息预处理单元:根据人员的进出记录信息,将人员的个人信息进行文本特征处理为onehot编码;
K-means聚类分析单元:将人员的进出信息和人员的个人信息输入K-means聚类分析算法,通过设置不同的类别数得到不同类别数量下的聚类损失函数值;
聚类分析优化单元:根据得到不同类别数量下的聚类损失函数值及类别数量拟合在当前数据集下的聚类损失对类别数的函数;将该拟合函数的拐点作为最佳分类数量,以最佳分类数量对应的聚类模型将社区区域范围内的人员进行聚类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川天翼网络服务有限公司,未经四川天翼网络服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010975588.8/1.html,转载请声明来源钻瓜专利网。