[发明专利]一种基于多标签的室内人群聚类方法有效
申请号: | 201711280844.6 | 申请日: | 2017-12-06 |
公开(公告)号: | CN107944498B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 戚荣志;李水艳;安纪存;毛莺池;平萍;黄倩 | 申请(专利权)人: | 河海大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;H04L29/12 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 李玉平 |
地址: | 210098 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 标签 内人 群聚 方法 | ||
1.一种基于多标签的室内人群聚类方法,其特征在于:通过AP设备采集每一秒钟进入区域内的MAC地址,针对每个MAC地址,根据其当日的所有状态数据计算出对应的多类标签数值;任意选取一个MAC地址,计算它与其他MAC地址的加权余弦距离,如果加权余弦距离小于预定义阈值K即归为一类,如果该区域内半数以上的MAC地址与待比较的MAC地址相似,那么也归为一类,最后得到多个不同的群体;
包括以下步骤:
步骤1:通过AP设备探测当前区域内拥有Wi-Fi模块的移动终端设备的MAC地址、信号强度RSSI和采集时间;
步骤2:AP设备将采集到的数据发送给服务器,服务器程序将每个MAC地址在当日是否处于区域内的状态序列按照时间升序进行存储;
步骤3:针对每个MAC地址,根据其状态序列得到停留该区域时间最长的一个时段的访问时间;
步骤4:针对每个MAC地址,根据其状态序列得到每次驻留该区域的平均时间;
步骤5:针对每个MAC地址,根据其状态序列得到回访周期的平均值;
步骤6:规定预定义阈值K,任选一个MAC地址与其他所有MAC地址对应的多类标签数值依次计算加权余弦距离,重复选择所有的MAC地址进行上述计算,使所有的MAC地址之间都有一个加权余弦距离;
步骤7:根据预定义阈值K和加权余弦距离对所有MAC地址进行群体划分。
2.如权利要求1所述的基于多标签的室内人群聚类方法,其特征在于:步骤1中AP设备采集到区域内所有的移动终端的MAC地址和RSSI值,每隔一秒采集一次然后发送到服务器中。
3.如权利要求1所述的基于多标签的室内人群聚类方法,其特征在于:步骤2中服务器程序根据RSSI的强弱判断该移动终端的是否在区域内,如果在区域内则状态为1,不在区域内状态为0,如果采集不到数据也为0,然后将状态序列进行存储。
4.如权利要求1所述的基于多标签的室内人群聚类方法,其特征在于:步骤3中针对每个MAC地址计算其停留该区域时间最长的一个时段的访问时间,在状态序列中,取出连续的由“1”组成的最长序列的起始时间即为停留该区域时间最长的一个时段的访问时间。
5.如权利要求1所述的基于多标签的室内人群聚类方法,其特征在于:步骤4中针对每个MAC地址计算其每次驻留该区域的平均时间,在状态序列中,过滤掉小于30秒的访问时间,其余访问时长取平均值得到每次驻留该区域的平均时间。
6.如权利要求1所述的基于多标签的室内人群聚类方法,其特征在于:步骤5中针对每个MAC地址计算其回访周期的平均值,在状态序列中,获取状态为连续0的序列的时长,去掉第一个连续0序列和最后一个连续0序列,剩余的0序列取平均值得到回访周期的平均值。
7.如权利要求1所述的基于多标签的室内人群聚类方法,其特征在于:步骤6中,手动设置预定义阈值K,根据具体场景进行调整,加权余弦距离权重A、B、C也为人工设定,每个MAC地址对应的停留该区域时间最长的一个时段的访问时间、每次驻留该区域的平均时间、回访周期的平均值的数值分别为
8.如权利要求7所述的基于多标签的室内人群聚类方法,其特征在于:步骤7中,根据预定义阈值K和二维数组
步骤S1:
步骤S2:
步骤S3:将第
步骤S4:
步骤S5:重复步骤S2-S4直到
步骤S6:
步骤S7:将第
步骤S8:
步骤S9:重复步骤S6-S8直到第一次遍历完未归类的下标;
步骤S10:设置
步骤S11:设置
步骤S12:重复步骤S2-S9,直到所有的数值计算完成,或者只留下一个未归类的下标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711280844.6/1.html,转载请声明来源钻瓜专利网。