[发明专利]一种基于高斯聚类与混合度量的WiFi指纹的室内定位方法有效
申请号: | 202110093814.4 | 申请日: | 2021-01-22 |
公开(公告)号: | CN112887902B | 公开(公告)日: | 2021-12-21 |
发明(设计)人: | 孙炜;张星;邹群鑫;罗敏辉;唐晨俊 | 申请(专利权)人: | 湖南大学 |
主分类号: | H04W4/02 | 分类号: | H04W4/02;H04W4/021;H04W4/33;H04W64/00;H04W84/12;G01S5/02;G01S5/14 |
代理公司: | 深圳叁众知识产权代理事务所(普通合伙) 44434 | 代理人: | 杜立光 |
地址: | 410012 *** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 高斯聚类 混合 度量 wifi 指纹 室内 定位 方法 | ||
1.一种基于高斯聚类与混合度量的WiFi指纹的室内定位方法,其特征在于,该方法包括离线数据模型训练和在线位置预测,其中,离线数据模型训练过程包括:
1)指纹数据库预处理:
将室内实验环境中的定位区域离散化为L个网格点,其中每个点都有其固定的点标签l,l=1,2,...,L,假设定位区域中用于定位的AP个数为M,则对于一个网格点l,其位置坐标表示为zl=(xl,yl),l处采集到的对应场地内所有AP的信号强度向量以及所有AP组成的向量可以写作:
apl=[ap1,ap2,...,apM]
其中,表示第m个AP在点l处所辐射的信号强度RSS的值,apm表示第m个AP,对于那些未能采集到的RSS,设定默认最小RSS为-90dBm,m=1,2,...,M,离线数据采集阶段,对L个点进行离线指纹数据库的构建,相应的所有指纹组成的指纹库DL×M可以表示为:
2)使用高斯聚类在定位空间划分子区域:
将训练用的所有指纹数据定义为K个高斯分布的线性组合:
其中,Ni(rl,μi,∑i)是均值为μi,协方差为∑i的高斯分布,πi是混合参数,为第i个高斯分布的权重,表征先验概率,并且
高斯分布的参数估计通过期望最大化EM算法确定; 具体而言,假设聚类个数为K,这意味着有K个均值μ1,μ2,...,μK,协方差矩阵∑1,∑2,...,∑K和权重π1,π2,…,πK;
首先,随机分配均值、协方差和权重,然后执行E步:对于每个指纹rj,j=1,2,...,L,计算其属于分布c的概率,ci,ck∈[c1,c2,…,cK]:
在执行完E步后,执行M步更新均值、协方差和权重:
其中,Li表示第i个簇中的指纹数量,基于此步骤生成的更新参数,计算每个指纹点的新概率,并迭代更新参数,以此反复使得对数似然函数最大化,对数似然函数如下:
最终得到了K个指纹簇,将点l处的指纹数据对应存在于第K个指纹簇的情形记为tl=K,得到标签向量可以写作:
T=[t1,t2,…,tL];
3)训练一个高准确率的随机森林分类器:
在对指纹聚类之后,利用差值指纹和其对应的子区域标签训练一个随机森林分类器,也称子区域判别模型; 由于指纹聚类后每个子区域(簇)中的指纹个数通常是不同的,使用随机森林能较好地解决样本不平衡的问题,因此我们使用随机森林作为子区域判别模型;为了增加训练样本数,对定位区域中的每个参考点都采集N次,指纹库的数据量就从DL×M变为DL×N×M,用来训练的指纹样本数为Ntrain=L×N;
将训练样本的指纹数据rl及高斯聚类所得到的标签向量T带入到随机森林中进行训练,目的是训练一个能够预测每一个指纹最大可能存在于哪一个簇中的随机森林分类器; 为了防止过拟合问题,我们采用了交叉验证的思想,将样本划分训练集和验证集,比例为7∶3;最终,使用一定数量的测试集测试判别模型的精度;
在线位置预测过程包括:
4)通过随机森林分类器得到指纹所在的子区域:
我们将在线阶段随机采集的待预测位置的点的指纹数据记为待查询RSS指纹rq,将rq输入到训练好的子区域判别模型内预测rq所在的子区域S;
5)依据混合度量标准计算指纹点之间的差异度:
对于一个待查询RSS指纹rq,为了减小RSS的波动性影响,我们从AP集、AP强度顺序和RSS3个角度来表征该指纹:
1-5)信号有效的AP集:
对待查询点q能进行有效信号辐射的ap保留,保留标准为apj对l所辐射的信号强度大于-90dBm,有效AP集可记为:
2-5)对有效AP集中的ap按其对rq辐射的信号强度值进行降序排序得到AP强度顺序向量:
3-5)混合指纹:
对于待查询指纹rq和子区域中的离线指纹ri,ri∈S,先计算得到rq的混合指纹并通过同样的计算步骤得到离线指纹ri的混合指纹然后计算两者的AP集距离、AP强度顺序距离以及RSS距离:
4-5)AP集距离:
对于样本的有效AP集,采用Jaccard相似度来计算两个样本的AP集距离:
5-5)AP强度顺序距离:
对于样本的AP强度顺序向量,采用最长公共子序列计算两个样本的AP强度顺序距离:
6-5)RSS距离:
对于样本的RSS向量,采用欧式距离计算两个样本的RSS差值距离:
drss=||rq-ri||2
由于dset和drank都是用来衡量样本间的相似程度,当dset和drank越大,两个指纹就越相似; 因此,我们使用函数n(d)=1-d2对距离dset和drank进行归一化,又因为0≤dset,drank≤1,我们有0≤n(dset),n(dset)≤1; 最终,两个指纹的差异度计算为:
其中,α,β>0为权重,其满足α+β=1;
6)在子区域中使用自适应KNN算法得到用户的位置预测结果:
在计算了待查询指纹和子区域中的离线指纹的差异度后,通过设置差异度阈值dres=σ*dmin来动态地筛选前K个近邻,其中dmin表示最小差异度,σ为阈值系数;
在使用自适应KNN算法对rq所在子区域S内的指纹数据进行匹配,并筛选得到K个候选参考点后,对其进行加权平均的方式得到rq的最终位置估计,其中∈是为了防止分母等于0设定的一个常量:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110093814.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种瓶口组装机
- 下一篇:一种核磁共振穿刺用定位引导装置