[发明专利]基于频域Bark子带的波束扫描方法及声源定向装置在审
| 申请号: | 202010965949.0 | 申请日: | 2020-09-15 |
| 公开(公告)号: | CN112034418A | 公开(公告)日: | 2020-12-04 |
| 发明(设计)人: | 王荔;张小博;陈龙 | 申请(专利权)人: | 北京中电慧声科技有限公司;中国电子科技集团公司第三研究所 |
| 主分类号: | G01S3/802 | 分类号: | G01S3/802 |
| 代理公司: | 北京天盾知识产权代理有限公司 11421 | 代理人: | 张彩珍 |
| 地址: | 100015 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 bark 波束 扫描 方法 声源 定向 装置 | ||
本发明涉及一种基于频域Bark子带的波束扫描方法及声源定向装置,包括步骤1:麦克风阵列采集声音信号,计算获得阵列频域输出信号模型;步骤2:根据采样频率和Bark子带中心频率求取感兴趣频点;估计感兴趣频点处阵列频域输出信号的协方差矩阵;步骤3:计算感兴趣频点对应的窄带空间谱;步骤4:将所有感兴趣频点窄带空间谱进行平均,获得平均空间谱;步骤5:在全角度区域进行平均空间谱搜索,获得声源方向。本发明能够有效提高声源定向精度,降低运算复杂程度。
技术领域
本发明涉及一种基于频域Bark子带的波束扫描方法及声源定向装置。
背景技术
基于麦克风阵列的声源定向是语音信号处理中的一个重要问题,它在视频会议、智能监控、人机语音交互等领域有着广泛的应用。基于麦克风阵列的声源定向方法大致可以分为三类:基于到达时间差的定向方法、基于最大输出功率的可控波束形成方法和基于高分辨谱估计的定向方法。
由于语音信号属于宽带信号,传统基于高分辨谱估计的声源定向方法在处理宽带信号时大多采用子带波束扫描方法,根据均匀子带划分的方式,将语音信号按照频带连续的原则分割成若干个相同带宽间隔的子带,再分别对每个子带数据求取空间谱,然后对所有子带空间谱进行平均,通过利用平均空间谱搜索,估计最终宽带信号的波达方向。语音信号能量大多集中在低频段(小于3400Hz),并不是在每个频段都一直包含语音成分,很大部分时间里,有些波段可能仅包含了噪声。传统子带波束扫描方法存在的不足之处在于,并未充分利用语音信号的频率特性,采用全频带定向,易受噪声波段影响,存在定向精度有限和计算复杂度高的问题,并且在低信噪比情况下算法极易发生失效。
发明内容
本发明的发明目的在于提供一种基于频域Bark子带的波束扫描方法及声源定向装置,有效提高声源定向精度,降低运算复杂程度。
基于同一发明构思,本发明具有两个独立的技术方案:
1、一种基于频域Bark子带的波束扫描方法,其特征在于,包括以下步骤:
步骤1:麦克风阵列采集声音信号,计算获得阵列频域输出信号模型;
步骤2:根据采样频率和Bark子带中心频率求取感兴趣频点;估计感兴趣频点处阵列频域输出信号的协方差矩阵;
步骤3:计算感兴趣频点对应的窄带空间谱;
步骤4:将所有感兴趣频点窄带空间谱进行平均,获得平均空间谱;
步骤5:在全角度区域进行平均空间谱搜索,获得声源方向。
进一步地,步骤1中,阵列频域输出信号模型通过如下方法计算,
第n个阵元时域输出为:
xn(t)=s(t+τn)+vn(t)
式中,vn(t)为第n个阵元的噪声,s(t)为声音信号,τn为信号到达第n个阵元对于到达参考原点的传播时延;
第n个阵元频域输出为:
式中,S(ωk)为频点ωk处信号的有限时间傅里叶变换,Vn(ωk)为频点ωk处第n个阵元上噪声的有限时间傅里叶变换。
对于N元阵列,阵列频域输出信号矢量具有下述形式:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中电慧声科技有限公司;中国电子科技集团公司第三研究所,未经北京中电慧声科技有限公司;中国电子科技集团公司第三研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010965949.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种柠檬皮丁的制备方法
- 下一篇:一种农业用丁草胺开瓶装置





