[发明专利]麦克风阵列的噪声自适应波束形成有效
申请号: | 201210052878.0 | 申请日: | 2012-03-02 |
公开(公告)号: | CN102708874A | 公开(公告)日: | 2012-10-03 |
发明(设计)人: | H·N·基科利 | 申请(专利权)人: | 微软公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;H04R3/00 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 蔡悦 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 麦克风 阵列 噪声 自适应 波束 形成 | ||
技术领域
本发明涉及通过不使用含噪声的信号来丢弃使性能降低的麦克风信号。
背景技术
麦克风阵列捕捉来自多个传感器的信号,并处理那些信号以便提高信噪比。在传统的波束形成中,一般方法是合并来自所有传感器(信道)的信号。波束形成的一个典型用途是将经合并的信号提供给语音识别器用于语音识别。
然而,在实践中,这一方法实际上会降低整体性能,并且确实,有时候执行起来甚至比单个麦克风更糟。这部分是因为麦克风之间的个体硬件差异,这会导致不同的麦克风拾取不同类型且不同量的噪声。另一个因素是噪声源可能会动态改变。此外,不同的麦克风不同地恶化,这再次导致降低的性能。
发明内容
提供本发明内容以便以简化形式介绍将在以下的具体实施例中进一步描述的一些代表性概念。本发明内容不旨在标识出所要求保护的主题的关键特征或必要特征,也不旨在以限制所要求保护的主题的范围的任何方式来使用。
简单来说,此处所描述的主题的各方面涉及一种自适应波束形成器/选择器藉由其来基于为每个信道所确定的本底噪声(noise floor)数据来选择使用麦克风阵列的哪些信道/麦克风的技术。在一个实现方式中,获取在没有实际信号(例如,没有语音)的时间期间的能量水平,并且一旦存在实际信号,信道选择器就基于本底信号数据选择要在信号处理中使用那个或哪些信道。本底噪声数据被反复测量,藉此,自适应波束形成器动态地适应于本底噪声数据随时间的变化。
在一个实现方式中,信道选择器选择在任一时刻用于信号处理(例如,语音识别)的信号信道并丢弃其它信道的信号。在另一实现方式中,信道选择器选择一个或多个信道,其中当选择了两个或更多信道时,来自每个所选择的信道的信号被合并以用于信号处理。
在一方面,分类器确定在噪声测量阶段何时获取本底噪声数据,以及在选择阶段何时作出选择。分类器可基于所检测到的能量水平的变化。
结合附图阅读以下具体实施方式,本发明的其他优点会变得显而易见。
附图说明
作为示例而非限制,在附图中示出了本发明,附图中相同的附图标记指示相同或相似的元素,附图中:
图1是表示用于麦克风阵列的噪声自适应波束形成器/选择器的示例组件的方框图。
图2是示例的8信道麦克风阵列的麦克风的噪声相对于语音信号的表示。
图3是表示估计麦克风阵列的输入信道的本底噪声能量的机制的方框图。
图4是表示噪声自适应波束形成器/选择器可如何使用基于噪声的信道选择来自适应地将信号提供给语音识别器的方框图。
图5是表示噪声检测阶段和信道选择阶段中的示例步骤的流程图。
图6是表示其中可实现此处所描述的各种实施例的一个或多个方面的示例性非限制计算系统或操作环境的框图。
具体实施方式
此处所描述的技术的各方面总的来说涉及通过不使用含噪声的信号来丢弃使性能降低的麦克风信号。此处所描述的噪声自适应波束形成技术尝试最小化麦克风硬件差异、动态改变的噪声源麦克风恶化和/或可能地其它因素所导致的不利效果,得到例如包括在最初以及在随硬件降级的一段时间内对语音识别有益的信号。
应当理解,此处的任何示例均是非限制性的。举例来说,虽然语音识别是此处所描述的技术的一项有用的应用,但是任何声音处理应用(例如,方向性放大和/或噪声抑制)可类似地受益。因此,本发明不限于在此描述的任何具体的实施例、方面、概念、结构、功能或示例。相反,此处所描述的实施例、方面、概念、结构、功能或示例中的任一个都是非限制性的,并且本发明一般能够以在声音处理和/或语音识别方面提供好处和优点的各种方式来使用。
图1示出了一个示例噪声自适应波束形成实现的组件。对应于麦克风阵列信道1021-102N的多个麦克风各自提供用于选择和/或波束形成的信号;可以理解的是,在一给定的阵列实现方式中,可存在至少两个(至多任意实际数量)这样的麦克风。
并且,麦克风阵列不需要被对称安放,并且实际上,在一个实现方式中,麦克风出于各种原因是非对称安放的。此处所描述的技术的一个应用是用于移动机器人,其可在等待来自人的语音时自主地四处移动,并因而可动态地暴露于不同的噪声源。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210052878.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:控制设备的音频
- 下一篇:一种充换电站监控系统的分布式数据实例化方法