[发明专利]基于声音位置指纹的迭代定位方法有效
| 申请号: | 201810611952.5 | 申请日: | 2018-06-14 |
| 公开(公告)号: | CN108896962B | 公开(公告)日: | 2022-02-08 |
| 发明(设计)人: | 杨鹏;徐静;孙昊;王硕朋;张晓萌 | 申请(专利权)人: | 河北工业大学 |
| 主分类号: | G01S5/18 | 分类号: | G01S5/18 |
| 代理公司: | 天津翰林知识产权代理事务所(普通合伙) 12210 | 代理人: | 胡安朋 |
| 地址: | 300130 天津市红桥区*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 声音 位置 指纹 定位 方法 | ||
1.基于声音位置指纹的迭代定位方法,其特征在于具体步骤如下:
A.声音位置指纹的离线采集阶段,构建声音位置指纹数据库并进行聚类:
第一步,定位场景的布置:
(1.1)在定位地图上布置由四个阵列元素M0、M1、M2和M3构成的分布式麦克风阵列,其中麦克风M0是参考麦克风;
(1.2)在上述第一步的(1.1)步的定位地图的四个顶点和中点布置5个参考点;
由此完成定位场景的布置;
第二步,声音位置指纹的获取:
(2.1)驱动移动机器人在上述第一步的(1.2)步选定的各个参考点释放位置声音,采用双参数双阈值的语音端点检测方法计算上述第一步的(1.1)步构成的分布式麦克风阵列中各路麦克风开始接收位置声音的起始时间,参考麦克风M0与其它麦克风的开始接收声音信号的时间差即声达时间差被提取出来作为参考点的声音位置特征向量,第i个参考点在时刻t采集到的声音位置特征向量记为其中1≤m≤M表示t时刻在第i个参考点处获得的第m个声音位置特征;M=3代表每个指纹包含的声音位置特征的数量;
(2.2)移动机器人分别在每个参考点处进行S次信号采集,用S次信号采集的声音位置特征向量的平均值作为参考点的声音位置特征向量存储起来,则第i个参考点的声音位置特征向量表示为Ri=[ri1,ri2,ri3],其中表示第i个参考点的第m个声音位置特征,表示第s次采集在第i个参考点的第m个声音位置特征;
(2.3)设定Li=[xi,yi]为第i个参考点的二维空间坐标,则上述第二步的(2.2) 步 中得到的第i个参考点的声音位置特征向量Ri与其对应的二维空间坐标组合构成一组声音位置指纹,记为Fi=[Ri,Li]=[ri1,ri2,ri3,xi,yi],其中xi表示第i个参考点的横坐标,yi表示第i个参考点的纵坐标;
由此完成声音位置指纹的获取;
第三步,构建声音位置指纹数据库,对声音位置指纹数据库进行聚类:
(3.1)将上述第二步的(2.3)步得到的所有参考点的声音位置指纹组合起来,构成初始状态的声音位置指纹数据库,记为:F=「F1F2...Fi...FI]T,其中Fi表示第i个参考点的声音位置指纹;
(3.2)采用基于声音位置的聚类方法对上述第三步的(3.1)步的构成初始状态的声音位置指纹数据库进行聚类,并定义聚类中心,具体操作是:将上述第一步的(1.1)步中的定位地图划分成由相邻参考点组成的互不重叠的三角形定位区域,将这些定位区域顺时针编号为:区域Z1,…,区域ZK,同一定位区域内的参考点归属到同一个聚类中,则同一聚类内参考点的声音位置指纹组成一个声音位置指纹集合如下:
其中,F_Zkn表示聚类k内第n个参考点的声音位置指纹,K表示聚类的数量,N表示聚类k内参考点的个数,直到所有参考点归到其所在的聚类之后,然后为每个聚类定义聚类中心,将形成聚类1、聚类2、…、聚类k、…、聚类K,共K个聚类中心,每个聚类中心的特征向量是该聚类内所有参考点特征向量的平均值,得到最终的声音位置指纹数据库;
由此完成构建声音位置指纹数据库,对声音位置指纹数据库进行聚类;
由此完成A.声音位置指纹的离线采集,构建声音位置指纹数据库并进行聚类;
B.声音位置指纹的在线定位阶段,获取待定位声源的最终定位结果:
第四步,选择聚类,即确定待定位声源所在的聚类:
(4.1)移动机器人在待定位声源处释放声音信号,上述第一步的(1.1)步构成的分布式麦克风阵列将会捕捉这一声音信号并上传至计算机,该计算机提取待定位声源的声音位置特征向量为Rx=[r1,r2,r3],其中rm表示待定位声源的第m个声音位置特征;
(4.2)使用欧式距离来计算待定位声源的声音位置特征向量Rx与上述第三步的(3.2)步中所述每个聚类中心的特征向量的相似度,计算公式为其中dk为Rx与之间的欧式距离;
(4.3)再利用公式argmin dk来确定待定位声源所在的聚类;
第五步,迭代定位,即待定位声源的位置计算:
(5.1)使用上述(4.3)步中确定的待定位声源所在的聚类作为初始输入开始迭代过程,其中F_Zkn表示聚类k内第n个邻近参考点的声音位置指纹;
(5.2)邻近虚拟参考点随着迭代过程不断更新,第l次迭代后,邻近虚拟参考点的声音位置指纹表示为:其中表示l次迭代后第n个邻近虚拟参考点的声音位置指纹;
(5.3)第l+1次迭代后,第n邻近虚拟参考点的声音位置指纹的计算公式如下:
公式(1)中,表示第l次迭代后第n个邻近虚拟参考点的权重系数,它的计算公式如下:
公式(2)中,表示第l次迭代后第n个邻近虚拟参考点与待定位声源之间的欧氏距离,随机数ε的作用是避免分母为0;
(5.4)使用加权K最邻近算法计算待定位声源的坐标,其计算公式如下:
公式(3)中,(xkn,ykn)表示聚类k中通过迭代最近一次迭代生成的第n个邻近虚拟参考点的位置坐标,wkn表示聚类k中通过迭代最近一次迭代生成的第n个邻近虚拟参考点的权重系数,wkn的计算公式如下:
公式(4)中,dkn表示聚类k中通过迭代最近一次生成的第n个邻近虚拟参考点与待定位声源之间的欧式距离,它的计算方法如下:
公式(5)中,rm表示待定位声源的第m个声音位置特征,rknm表示最近一次迭代后第n个邻近虚拟参考点的第m个声音位置特征;
通过第五步的(5.1)-(5.4)步完成迭代定位,待定位声源的位置计算;
第六步,计算待定位声源的定位误差:
待定位声源的定位误差的计算方法表达为:
公式(6)中,x表示待定位声源实际物理位置的横坐标,y表示待定位声源实际物理位置的纵坐标,表示待定位声源实际测试位置的横坐标,表示待定位声源实际测试位置的纵坐标;
由公式(6)完成计算待定位声源的定位误差;
第七步,输出待定位声源最终的定位结果:
(7.1)不断重复上述第五步和第六步的步骤,每一次迭代后计算得到的定位结果与定位误差都将被保存下来;
(7.2)直到定位误差稳定时结束上述计算操作的迭代过程,输出待定位声源最终的定位结果;
由此完成声音位置指纹的在线定位阶段,并获取待定位声源的最终定位结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北工业大学,未经河北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810611952.5/1.html,转载请声明来源钻瓜专利网。





