[发明专利]基于频域Bark子带的波束扫描方法及声源定向装置在审

申请号：	202010965949.0	申请日：	2020-09-15
公开（公告）号：	CN112034418A	公开（公告）日：	2020-12-04
发明（设计）人：	王荔;张小博;陈龙	申请（专利权）人：	北京中电慧声科技有限公司;中国电子科技集团公司第三研究所
主分类号：	G01S3/802	分类号：	G01S3/802
代理公司：	北京天盾知识产权代理有限公司 11421	代理人：	张彩珍
地址：	100015 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于 bark 波束扫描方法声源定向装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种基于频域Bark子带的波束扫描方法及声源定向装置，包括步骤1：麦克风阵列采集声音信号，计算获得阵列频域输出信号模型；步骤2：根据采样频率和Bark子带中心频率求取感兴趣频点；估计感兴趣频点处阵列频域输出信号的协方差矩阵；步骤3：计算感兴趣频点对应的窄带空间谱；步骤4：将所有感兴趣频点窄带空间谱进行平均，获得平均空间谱；步骤5：在全角度区域进行平均空间谱搜索，获得声源方向。本发明能够有效提高声源定向精度，降低运算复杂程度。

技术领域

本发明涉及一种基于频域Bark子带的波束扫描方法及声源定向装置。

背景技术

基于麦克风阵列的声源定向是语音信号处理中的一个重要问题，它在视频会议、智能监控、人机语音交互等领域有着广泛的应用。基于麦克风阵列的声源定向方法大致可以分为三类：基于到达时间差的定向方法、基于最大输出功率的可控波束形成方法和基于高分辨谱估计的定向方法。

由于语音信号属于宽带信号，传统基于高分辨谱估计的声源定向方法在处理宽带信号时大多采用子带波束扫描方法，根据均匀子带划分的方式，将语音信号按照频带连续的原则分割成若干个相同带宽间隔的子带，再分别对每个子带数据求取空间谱，然后对所有子带空间谱进行平均，通过利用平均空间谱搜索，估计最终宽带信号的波达方向。语音信号能量大多集中在低频段(小于3400Hz)，并不是在每个频段都一直包含语音成分，很大部分时间里，有些波段可能仅包含了噪声。传统子带波束扫描方法存在的不足之处在于，并未充分利用语音信号的频率特性，采用全频带定向，易受噪声波段影响，存在定向精度有限和计算复杂度高的问题，并且在低信噪比情况下算法极易发生失效。

发明内容

本发明的发明目的在于提供一种基于频域Bark子带的波束扫描方法及声源定向装置，有效提高声源定向精度，降低运算复杂程度。

基于同一发明构思，本发明具有两个独立的技术方案：

1、一种基于频域Bark子带的波束扫描方法，其特征在于，包括以下步骤：

步骤1：麦克风阵列采集声音信号，计算获得阵列频域输出信号模型；

步骤2：根据采样频率和Bark子带中心频率求取感兴趣频点；估计感兴趣频点处阵列频域输出信号的协方差矩阵；

步骤3：计算感兴趣频点对应的窄带空间谱；

步骤4：将所有感兴趣频点窄带空间谱进行平均，获得平均空间谱；

步骤5：在全角度区域进行平均空间谱搜索，获得声源方向。

进一步地，步骤1中，阵列频域输出信号模型通过如下方法计算，

第n个阵元时域输出为：

x_n(t)＝s(t+τ_n)+v_n(t)