[发明专利]一种基于多标签的室内人群聚类方法有效

专利信息
申请号: 201711280844.6 申请日: 2017-12-06
公开(公告)号: CN107944498B 公开(公告)日: 2021-08-31
发明(设计)人: 戚荣志;李水艳;安纪存;毛莺池;平萍;黄倩 申请(专利权)人: 河海大学
主分类号: G06K9/62 分类号: G06K9/62;H04L29/12
代理公司: 南京苏高专利商标事务所(普通合伙) 32204 代理人: 李玉平
地址: 210098 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 标签 内人 群聚 方法
【说明书】:

发明公开了一种基于多标签的室内人群聚类方法。该方法包括以下步骤:(1)通过AP设备得到区域内移动终端设备的访问状态;(2)计算出每个移动终端的多类标签,标签包含:①访问时段:以分钟为单位得到访问区域最频繁的进入时间;②平均访问时长:过滤掉极短的停留时间,移动终端在区域内停留的平均时间;③平均回访周期:当天时间内,终端设备距离上次访问该区域的时间;(3)以每个标签为一个维度将每个终端映射为多维坐标系下的点;(4)任选一个点,规定一个相似半径K,依次计算每个点与选中点的加权余弦距离d,将加权余弦距离小于相似半径的点归为一类,如果群体中半数以上的点与目标点相似,那么认为目标点属于该群体。

技术领域

本发明涉及一种基于多标签的室内人群聚类方法,属于数据分析技术领域。

背景技术

当前环境下,随着智能手机的用户量增长和Wi-Fi网络的普及,几乎每个商场、写字楼、酒店等公共区域内都遍布着Wi-Fi网络。经过这些区域内的人群均可以连接相应的网络访问互联网。当前区域内人流的访问情况以及访问群体的类别信息成为了宝贵的财富。当前区域内人群聚类算法大部分是基于位置密度的距离算法或者是根据人工调查后的年龄、性别等标签进行聚类。基于密度的聚类方法不适用于小范围流动性大的区域,而年龄、性别等容易涉及到个人隐私。

因此有必要提出一种采集移动设备信息作为数据源、多标签的室内人群聚类方法。该方法仅仅使用获取到的MAC地址、RSSI信号强弱等信息来进行人群的聚类,不涉及到个人隐私,也无需对个人信息和采集到的信息进行精确匹配,可以有效地保护区域内人流的隐私,也不需要个人主动提供信息。

发明内容

发明目的:针对现有技术中存在的问题,本发明提供一种基于多标签的室内人群聚类方法。

技术方案:一种基于多标签的室内人群聚类方法,包括以下步骤:

步骤1:通过AP设备探测当前区域内拥有Wi-Fi模块的移动终端设备的MAC地址、信号强度RSSI和采集时间;

步骤2:AP设备将采集到的数据发送给服务器,服务器程序将每个MAC地址在当日是否处于区域内的状态序列按照时间升序进行存储;

步骤3:针对每个MAC地址,根据其状态序列得到停留该区域时间最长的一个时段的访问时间;

步骤4:针对每个MAC地址,根据其状态序列得到每次驻留该区域的平均时间;

步骤5:针对每个MAC地址,根据其状态序列得到回访周期的平均值;

步骤6:规定相似阈值K,任选一个MAC地址与其他所有MAC地址对应的标签依次计算加权余弦距离,重复选择所有的MAC地址进行上述计算,使所有的MAC地址之间都有一个余弦距离;

步骤7:根据K值和余弦距离对所有MAC地址进行群体划分。

步骤1中AP设备采集到区域内所有的移动终端的MAC地址和RSSI值,每隔一秒采集一次然后发送到服务器中。

步骤2中服务器程序根据RSSI的强弱判断该移动终端的是否在区域内,如果在区域内则状态为1,不在区域内状态为0,如果采集不到数据也为0。每个MAC地址所对应的状态序列样例为:00001111111111111110000...111100,然后将状态序列进行存储。

步骤3中针对每个MAC地址计算其停留时间最长的时间段的访问时间,在状态序列中,取出连续的由“1”组成的最长序列的起始时间即为访问时间。

步骤4中针对每个MAC地址计算其平均驻留时长,在状态序列中,过滤掉小于30秒的访问时间,其余访问时长取平均值得到平均访问时长。

步骤5中针对每个MAC地址计算其平均回访周期,在状态序列中,获取状态为连续0的序列的时长,去掉第一个连续0序列和最后一个连续0序列,剩余的0序列取平均值得到平均回访周期。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711280844.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top