[发明专利]一种基于多标签的室内人群聚类方法有效

专利信息
申请号: 201711280844.6 申请日: 2017-12-06
公开(公告)号: CN107944498B 公开(公告)日: 2021-08-31
发明(设计)人: 戚荣志;李水艳;安纪存;毛莺池;平萍;黄倩 申请(专利权)人: 河海大学
主分类号: G06K9/62 分类号: G06K9/62;H04L29/12
代理公司: 南京苏高专利商标事务所(普通合伙) 32204 代理人: 李玉平
地址: 210098 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 标签 内人 群聚 方法
【权利要求书】:

1.一种基于多标签的室内人群聚类方法,其特征在于:通过AP设备采集每一秒钟进入区域内的MAC地址,针对每个MAC地址,根据其当日的所有状态数据计算出对应的多类标签数值;任意选取一个MAC地址,计算它与其他MAC地址的加权余弦距离,如果加权余弦距离小于预定义阈值K即归为一类,如果该区域内半数以上的MAC地址与待比较的MAC地址相似,那么也归为一类,最后得到多个不同的群体;

包括以下步骤:

步骤1:通过AP设备探测当前区域内拥有Wi-Fi模块的移动终端设备的MAC地址、信号强度RSSI和采集时间;

步骤2:AP设备将采集到的数据发送给服务器,服务器程序将每个MAC地址在当日是否处于区域内的状态序列按照时间升序进行存储;

步骤3:针对每个MAC地址,根据其状态序列得到停留该区域时间最长的一个时段的访问时间;

步骤4:针对每个MAC地址,根据其状态序列得到每次驻留该区域的平均时间;

步骤5:针对每个MAC地址,根据其状态序列得到回访周期的平均值;

步骤6:规定预定义阈值K,任选一个MAC地址与其他所有MAC地址对应的多类标签数值依次计算加权余弦距离,重复选择所有的MAC地址进行上述计算,使所有的MAC地址之间都有一个加权余弦距离;

步骤7:根据预定义阈值K和加权余弦距离对所有MAC地址进行群体划分。

2.如权利要求1所述的基于多标签的室内人群聚类方法,其特征在于:步骤1中AP设备采集到区域内所有的移动终端的MAC地址和RSSI值,每隔一秒采集一次然后发送到服务器中。

3.如权利要求1所述的基于多标签的室内人群聚类方法,其特征在于:步骤2中服务器程序根据RSSI的强弱判断该移动终端的是否在区域内,如果在区域内则状态为1,不在区域内状态为0,如果采集不到数据也为0,然后将状态序列进行存储。

4.如权利要求1所述的基于多标签的室内人群聚类方法,其特征在于:步骤3中针对每个MAC地址计算其停留该区域时间最长的一个时段的访问时间,在状态序列中,取出连续的由“1”组成的最长序列的起始时间即为停留该区域时间最长的一个时段的访问时间。

5.如权利要求1所述的基于多标签的室内人群聚类方法,其特征在于:步骤4中针对每个MAC地址计算其每次驻留该区域的平均时间,在状态序列中,过滤掉小于30秒的访问时间,其余访问时长取平均值得到每次驻留该区域的平均时间。

6.如权利要求1所述的基于多标签的室内人群聚类方法,其特征在于:步骤5中针对每个MAC地址计算其回访周期的平均值,在状态序列中,获取状态为连续0的序列的时长,去掉第一个连续0序列和最后一个连续0序列,剩余的0序列取平均值得到回访周期的平均值。

7.如权利要求1所述的基于多标签的室内人群聚类方法,其特征在于:步骤6中,手动设置预定义阈值K,根据具体场景进行调整,加权余弦距离权重A、B、C也为人工设定,每个MAC地址对应的停留该区域时间最长的一个时段的访问时间、每次驻留该区域的平均时间、回访周期的平均值的数值分别为abc,使用一个二维数组d[N][N],N表示所有MAC地址的数量,d[i][j]表示第i个MAC地址与第j个MAC地址的加权余弦距离。

8.如权利要求7所述的基于多标签的室内人群聚类方法,其特征在于:步骤7中,根据预定义阈值K和二维数组d[N][N]划分不同的群体,具体包括如下步骤:

步骤S1:i设置为0,j设置为1; I群体表示第i个MAC地址属于的群体;

步骤S2:x为I群体中所有MAC地址的下标,循环判断d[x][j]是否超过半数小于预定义阈值K,如果是,则进入步骤S3,否则进入步骤S4;

步骤S3:将第i个MAC地址、第j个MAC地址归为一个群体,第j个MAC地址标记为已归类;

步骤S4:j设置为下一个未归类的下标;

步骤S5:重复步骤S2-S4直到j等于N;

步骤S6: y为未归类的所有MAC地址的下标,遍历所有y,再次判断第y个MAC地址是否属于I群体,如果是进入步骤S7,否则进入步骤S8;

步骤S7:将第y个MAC地址与第i个MAC地址归为一个群体,第y个MAC地址标记为已归类;

步骤S8:y设为下一个未归类的下标;

步骤S9:重复步骤S6-S8直到第一次遍历完未归类的下标;

步骤S10:设置i为第一个未归类的下标;

步骤S11:设置j为第二个未归类的下标;

步骤S12:重复步骤S2-S9,直到所有的数值计算完成,或者只留下一个未归类的下标。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711280844.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top