[发明专利]基于干扰噪声空间谱矩阵的语音信号波束成形方法有效
申请号: | 202211565066.6 | 申请日: | 2022-12-07 |
公开(公告)号: | CN116312602B | 公开(公告)日: | 2023-10-03 |
发明(设计)人: | 肖永雄;宛敏红;宋伟;朱世强;顾建军 | 申请(专利权)人: | 之江实验室 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 311121 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 干扰 噪声 空间 矩阵 语音 信号 波束 成形 方法 | ||
本发明公开了一种基于干扰噪声空间谱矩阵的语音信号波束成形方法与装置。本发明基于麦克风阵列流形矢量计算球面扩散噪声的空间谱矩阵;在麦克风没有检测到语音信号时,计算背景噪声的空间谱矩阵;在麦克风检测到语音信号后,计算信号空间谱矩阵;基于麦克风阵列流形矢量和信号空间谱矩阵对Capon空间谱进行积分,计算干扰语音信号的空间谱矩阵;球面扩散噪声的空间谱矩阵、背景噪声的空间谱矩阵、干扰语音信号的空间谱矩阵叠加得到干扰噪声空间谱矩阵;对干扰噪声空间谱矩阵进行特征值分解,获取特征向量和噪声功率估计值,并以此更新干扰噪声空间谱矩阵;并结合线性约束最小方差波束形成得到波束增强的语音信号。
技术领域:
本发明涉及阵列语音信号处理领域和波束成形技术领域,特别涉及一种基于干扰噪声空间谱矩阵构造的波束成形方法与装置,以提升人机语音交互过程中对干扰语音信号、空间扩散噪声、室内背景噪声和混响的抑制性能。
背景技术:
机器人听觉主要解决的是“鸡尾酒舞会”问题,即在吵杂的声场环境中,“听清”目标说话人的语音信号。由于麦克风阵列能充分利用声场的空间信息,已成为机器人听觉领域主要采用的硬件结构。基于麦克风阵列的波束成形技术可以有效抑制波束外干扰语音信号和其他噪声信号,增强目标方向的语音信号,提升语音识别率,实现说话人分离,已获得了广泛的研究和关注。
标准的Capon波束成形方法(MVDR)在干扰噪声空间谱矩阵和导向矢量精确已知时,能够达到理论最优。然而对于多人同时说话的场景,麦克风采集到的是目标语音信号、干扰语音信号和其他噪声的叠加,而且实时采集的信号样本是有限的,无法准确地计算出干扰噪声空间谱矩阵。此外,由于声场中存在散射和反射、麦克风位置和声源定位等误差的存在,通常无法获得准确的导向矢量。干扰噪声空间谱矩阵和导向矢量的失配使得Capon波束成形方法直接损害目标语音信号,这对智能语音识别等后端算法来说是不可接受的。
线性约束最小方差波束形成方法(LCMV)由Frost L.提出,在MVDR的基础上增加了线性约束,例如某些干扰方向的零点约束,并可以采用微分约束,拓宽对干扰语音信号的抑制角度,对信号到达方向的不确定性具有更好的稳健性。然而LCMV方法同样要求干扰噪声空间谱矩阵是准确的。
为了提高波束成形方法的性能,在保护目标语音信号的同时,尽可能的抑制干扰和噪声,学者们提出了许多改进的算法。最简单和常用的是MVDR对角加载法,消除矩阵的病态性,减小目标语音信号的损害,但存在对角加载量难以确定的问题。文献1“RobustAdaptive Beamforming Based on Interference Covariance Matrix Reconstructionand Steering Vector Estimation,IEEE Trans.Signal Process.,vol.60,no.7,pp.3881-3885,2012.”中提出了一种在除目标语音信号所在角度区域外的整个空间区域对Capon空间谱进行积分,从而重构干扰噪声协方差矩阵(空间谱矩阵是其频域体现),并通过求解一个二次约束二次规划问题来提升导向矢量精度的波束成形方法。然而重构的干扰噪声协方差仍然存在病态性的问题,导致目标语音信号的损伤。
中国专利CN105182298A提供了《一种针对来波方向误差的干扰噪声协方差矩阵重构方法》在文献1的基础上,将对Capon空间谱的积分改写为求和近似,并利用特征值分解来减小求和代替积分带来的近似误差,然后采用最大特征值对应的特征向量代替干扰语音信号的导向矢量,并按照定义对干扰噪声协方差矩阵进行重构。这种方法虽然减少了一部分计算量,解决了矩阵病态性问题,但是不可避免地丢失了部分干扰语音信号的空间信息,降低了波束成形方法对干扰语音信号的抑制性能。
发明内容:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211565066.6/2.html,转载请声明来源钻瓜专利网。