[发明专利]强混响环境下基于参数化贝叶斯字典学习的声源定位方法有效
申请号: | 201611251992.0 | 申请日: | 2016-12-30 |
公开(公告)号: | CN106842112B | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 王璐;刘延善;王强;曾向阳 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G01S1/76 | 分类号: | G01S1/76 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 王鲜凯 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种强混响环境下基于参数化贝叶斯字典学习的声源定位方法,用于解决现有声源定位方法精确度差的技术问题。技术方案是基于传声器镜像简化字典,在稀疏贝叶斯的框架下,实现声源定位和房间反射系数的同步估计求解。利用本发明方法将字典预先计算出来,完成声源定位和反射系数估计的效率可以得到提升,这样在没有显著提升计算量的情况下,提高了声源定位方法的精度。本发明对复杂室内环境下的声源定位有很大的潜在实用价值,也可作为封闭空间中声学参数估计的方法。 | ||
搜索关键词: | 混响 环境 基于 参数 化贝叶斯 字典 学习 声源 定位 方法 | ||
【主权项】:
1.一种强混响环境下基于参数化贝叶斯字典学习的声源定位方法,其特征在于包括以下步骤:步骤一、定位环境选取能够用于矩形或根据形状直接获取虚源的房间;选定房间内某一维或二维平面进行室内网格划分,假设室内网格点数目为G;步骤二、构建信号模型:声源定位时需要获得的目标信息是声源在房间中的位置,这一信息的量化离散化为分布在室内空间以及室外镜像空间的有限个网格点,每个网格点的声源幅度为xg;假设声源存在于任意一个网格点内,任意位置的接收信号y(r,f)表示为式(1)
式中,f为当前频率,c为空气中的声速,G为室内网格点数目,βg为对应虚源的反射系数,xg反映了第g个声源位置的声源幅度;在所有的G个网格点上,xg只有很少的一些非零元数,对应于房间空间的实际声源位置和镜像空间的虚声源位置;在构造字典时,只在房间内部设定网格点,每个字典元素为声源存在的内部网格点与接收点镜像之间的通道叠加;由此得到![]()
yf=Afxf (4)式(2)右端表示传声器及其镜像声能量贡献的总叠加,式(3)为字典原子计算公式,N0为接收点镜像级数,
为ns,i阶镜像对应的声压反射系数;整理式(3)得到式(4);式中,yf∈CM×1,xf∈CG×1,Af∈CM×G;步骤三、接收点镜像求解:对于尺寸为lx×ly×lz的矩形房间,假设接收点位置为(x0,y0,z0),某级接收点镜像的位置为(xi,yi,zi),l、m、n是界于‑∞和+∞之间的整数,则任意接收点镜像的空间坐标表示为
镜像的反射级数由下式给出N=|2l‑Δl|+|2m‑Δm|+|2n‑Δn| (6)Δl=1表示求xi式中x0前取负;Δl=0表示求xi式中x0前取正;Δm=1表示求yi式中y0前取负;Δm=0表示求yi式中y0前取正;Δn=1表示求zi式中z0前取负;Δn=0表示求zi式中z0前取正;步骤四、构造求解字典:按式(3)构造反射系数β的不同量化数值下的字典Af及其对β的一阶导数A'f和二阶导数矩阵A”f;步骤五、位置向量xf求解:在进行室内声定位时,房间内的网格点数目G不仅远远大于传声器个数M,而且大于声源个数;即xf具有空间稀疏性,通过稀疏贝叶斯方法估计含有声源位置信息的x;观察信号由式(7)采样得到;
IM为M维的单位阵,xf由下式得到:
其中
上式中
表示复高斯分布,Gamma表示伽马分布;上述概率模型通过变分贝叶斯‑期望最大化算法求解;其中xf的后验概率通过式(9)得到:![]()
表示对应变量的估计值;下面直接给出各参数估计的方法,其中
服从均值为
的Gamma分布;α0服从均值为
的高斯分布,Tr表示矩阵的迹;步骤六、参数β的估计:上述各字典中包含反射系数β参数,估计该参数等价于使式(10)最小化:
该最优化问题通过Newton法求解,迭代公式如下:
式中,A'f表示对对应的参数β求导,A”f表示二阶导数;通过对稀疏贝叶斯框架中的字典引入反射系数作为参数,并通过Newton法迭代解决该问题,通过分步求解,实现在估计声源位置xf的同时,估计出该反射系数β;改参数的估计一方面为房间声学参数估计,同时也得到更准确的房间声学信息,达到更好的声源定位效果;步骤七、参数β量化:在房间信息完全未知的情况下,β的初值设置为0.5,通过带参数的贝叶斯稀疏方法,分别利用式(9)和式(10)对声源位置xf和反射系数β进行估计,反射系数估计与声源位置的估计是同时进行的,即在式(9)和式(10)之间反复进行,每步迭代都需要估计反射系数并通过量化寻找最接近的字典并进行下一步迭代,β不同将导致字典多次重新计算,带来巨大的计算量;为了避免重复计算字典,首先将β在其值域范围(0~1)内量化为若干离散数据点,然后将这些离散点的值对应的字典在迭代前计算出来,将计算得到的β量化到对应的离散值上并调用对应的字典可显著减少计算量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611251992.0/,转载请声明来源钻瓜专利网。