[发明专利]强混响环境下基于参数化贝叶斯字典学习的声源定位方法有效
申请号: | 201611251992.0 | 申请日: | 2016-12-30 |
公开(公告)号: | CN106842112B | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 王璐;刘延善;王强;曾向阳 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G01S1/76 | 分类号: | G01S1/76 |
代理公司: | 西北工业大学专利中心 61204 | 代理人: | 王鲜凯 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 混响 环境 基于 参数 化贝叶斯 字典 学习 声源 定位 方法 | ||
本发明公开了一种强混响环境下基于参数化贝叶斯字典学习的声源定位方法,用于解决现有声源定位方法精确度差的技术问题。技术方案是基于传声器镜像简化字典,在稀疏贝叶斯的框架下,实现声源定位和房间反射系数的同步估计求解。利用本发明方法将字典预先计算出来,完成声源定位和反射系数估计的效率可以得到提升,这样在没有显著提升计算量的情况下,提高了声源定位方法的精度。本发明对复杂室内环境下的声源定位有很大的潜在实用价值,也可作为封闭空间中声学参数估计的方法。
技术领域
本发明涉及一种声源定位方法,特别涉及一种强混响环境下基于参数化贝叶斯字典学习的声源定位方法。
背景技术
文献“Structured sparsity models for reverberant speech separation,Audio,Speech,and Language Processing,IEEE/ACM Transactions on,vol.22,pp.620-633,2014”借助房间内部采集的多个传声器信号,在房间内外设置多个网格点估计房间形状以及多级虚声源,其次利用房间的虚声源模型估计房间的吸声系数,最后使用凸优化的数据算法来进行室内多源分离的研究。然而,当室内混响较强时,空间内设定网格点数目会极大地增加,且吸声参数未知,该方法所涉及得估计变量较多,计算效率低下,求解算法精度不高,因而无法准确计算获得室内声源的位置。因此,对于室内声源定位,对未知房间的声学参数进行准确估计是合理估计房间声源位置信息的前提条件。
发明内容
为了克服现有声源定位方法精确度差的不足,本发明提供一种强混响环境下基于参数化贝叶斯字典学习的声源定位方法。该方法基于传声器镜像简化字典,在稀疏贝叶斯的框架下,实现声源定位和房间反射系数的同步估计求解。利用本发明方法将字典预先计算出来,完成声源定位和反射系数估计的效率可以得到提升,这样在没有显著提升计算量的情况下,提高了声源定位方法的精度。本发明对复杂室内环境下的声源定位有很大的潜在实用价值,也可作为封闭空间中声学参数估计的方法。
本发明解决其技术问题所采用的技术方案:一种强混响环境下基于参数化贝叶斯字典学习的声源定位方法,其特点是包括以下步骤:
步骤一、定位环境选取能够用于矩形或根据形状直接获取虚源的房间。选定房间内某一维或二维平面进行室内网格划分,假设室内网格点数目为G。
步骤二、构建信号模型:声源定位时需要获得的目标信息是声源在房间中的位置,这一信息的量化离散化为分布在室内空间以及室外镜像空间的有限个网格点,每个网格点的声源幅度为xg。假设声源存在于任意一个网格点内,任意位置的接收信号y(r,f)表示为式(1)
式中,f为当前频率,c为空气中的声速,G为室内网格点数目,βg为对应虚源的反射系数,xg为反映声源位置的向量。在所有的G个网格点上,xg只有很少的一些非零元数,对应于房间空间的实际声源位置和镜像空间的虚声源位置。在构造字典时,只在房间内部设定网格点,每个字典元素为声源存在的内部网格点与接收点镜像之间的通道叠加。由此得到
yf=Afxf (4)
式(2)右端表示传声器及其镜像声能量贡献的总叠加,式(3)为字典原子计算公式,N0为接收点镜像级数,为ns,i阶镜像对应的声压反射系数。整理式(3)得到式(4)。式中,yf∈CM×1,xf∈CG×1,Af∈CM×G。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611251992.0/2.html,转载请声明来源钻瓜专利网。