[发明专利]一种基于Wi-Fi指纹库文本分类的室内房间级定位方法有效
申请号: | 202010050102.X | 申请日: | 2020-01-17 |
公开(公告)号: | CN111259146B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 郑增威;汪振;陈垣毅;陈丹 | 申请(专利权)人: | 浙江大学城市学院 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/216;G06F40/151;H04B17/318;H04W64/00 |
代理公司: | 杭州九洲专利事务所有限公司 33101 | 代理人: | 张羽振 |
地址: | 310015*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 wi fi 指纹 文本 分类 室内 房间 定位 方法 | ||
1.一种基于Wi-Fi指纹库文本分类的室内房间级定位方法,其特征在于,包括以下步骤:
步骤1、首先采集商场室内环境中的Wi-Fi信号强度以及基本服务集标识符;统计基本服务集标识符出现的次数,将基本服务集标识符出现次数小于5次的数据剔除;构建Wi-Fi指纹库;所述Wi-Fi指纹库中有标签S={s1,…,sr},si为商场中第i编号的商铺标签;
将剔除后的基本服务集标识符替换成接入点APs={AP1,…,APn},Wi-Fi指纹库的Wi-Fi信号强度为f={f1,…,fn},其中n为特征个数;fi为接入点APi的信号强度值,i的范围为[1,n],fi的范围为(-100,0);
步骤2、将Wi-Fi指纹库转换成短文本数据:将Wi-Fi信号强度大小和接入点Aps的标签结合生成短文本单词,多个短文本单词构成一句短句作为特征;将参数α设定为α=10,按照RSSI的大小范围进行转换:
如果RSSI(APn)-50,转换成单词为AP_n_1;
如果-60RSSI(APn)=-50,转成单词为AP_n_2;
如果-70RSSI(APn)=-60,转换成单词为AP_n_3;
如果-80RSSI(APn)=-70,转换成单词为AP_n_4;
如果-90RSSI(APn)=-80,转换成单词为AP_n_5;
如果-100RSSI(APn)=-90,转换成单词为AP_n_6;
如果RSSI(APn)-100,转换成单词为AP_n_7;
所述RSSI为信号强度;n对应APn的下标值;得到短文本数据{Sr|AP_k_X},其中X=1,2,3,4,5,6,7;X的值由上述转换方式得到,k=1,2,…,n;
从短文本数据中剔除单词AP_n_7,将短文本数据划分成训练集和测试集;
步骤3、进行特征选择和单词权重计算:
步骤3.1、将文档频率DF低于阈值的样本特征作为低频特征,将低频特征直接去除;所述文档频率DF为样本特征在训练集中出现的次数;
步骤3.2、使用TF-IDF函数计算权重:
Weight=TF×IDF (1)
上式(1)中,Weight为权重,TF为词频,所述词频为单个短文本单词在每行中出现的概率;IDF为倒排文档频率,所述倒排文档频率为单个短文本单词在整个列表数据集中出现频数的倒数;上式(2)中,n为包含该特征项的短句个数,N表示整个训练集中短句的个数,用来修正该特征项的偏差;
步骤4、使用Crammer-Singer支持向量分类器:将一个测试集数据内的测试样本x划分到第r类,使得矩阵M的第r行与测试样本x的内积最大:
上式(3)中,x为测试样本;Mr为矩阵的第r行;
将训练集数据输入到文本分类器中,进行训练生成模型;
步骤5、计算分类精度:使用步骤4中产生的模型来对测试集数据进行预测分类,将与实际商铺标签相同的测试集数据作为正例,将与实际商铺标签不同的测试集数据作为负例;计算分类精度:
上式(4)中,TP为正确划分为正例的个数,FP为错误划分为正例的个数,TN为正确划分负例的个数,FN为错误划分为负例的个数。
2.根据权利要求1所述的基于Wi-Fi指纹库文本分类的室内房间级定位方法,其特征在于:步骤1所述接入点APi的信号强度值fi呈正态分布。
3.根据权利要求1所述的基于Wi-Fi指纹库文本分类的室内房间级定位方法,其特征在于:步骤2所述RSSI的值不等于-100,-100对应空信号强度将空信号强度表示为没有检测到Wi-Fi信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学城市学院,未经浙江大学城市学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010050102.X/1.html,转载请声明来源钻瓜专利网。