[发明专利]一种用于对声音编码、同时抑制声学背景噪声的系统和方法无效
| 申请号: | 98812990.6 | 申请日: | 1998-12-03 |
| 公开(公告)号: | CN1285945A | 公开(公告)日: | 2001-02-28 |
| 发明(设计)人: | L·S·布勒鲍姆;P·M·约翰森 | 申请(专利权)人: | 艾利森公司 |
| 主分类号: | G10L21/02 | 分类号: | G10L21/02 |
| 代理公司: | 中国专利代理(香港)有限公司 | 代理人: | 陈霁,李亚非 |
| 地址: | 美国北卡*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 声音 编码 同时 抑制 声学 背景 噪声 系统 方法 | ||
发明领域
本发明涉及对语音编码的系统和方法,更特殊地,涉及集成有声学噪声抑制的声音编码器。
发明背景
尽管语音在本质上是模拟的,但是常常需要在数字通讯信道上传输或在数字媒体中存储。在这种情况下,语音信号必须通过多种方法或技术中的一种来采样和编码。每种编码技术都有一种相关的解码器,用来根据所传输和存储的值而合成或重构语音。编码器和解码器的组合通常称作编一解码器或coder。
在语音编码领域有很多已知的技术。这些技术大致分为两类:波形编码和参数编码。波形编码器尝试自己对语音进行量化和编码。这些技术被用于大多数现代的公共电话网中,并且以相对较低的复杂度产生高质量的语音。然而,波形编码器并不是特别有效,意思是,为了获得期望的重构语音质量,必须传输或存储相对大量的信息。在某些传输带宽或存储容量有限的应用中,这一点是不可接受的。
通常,参数编码器能够以低于波形编码器的信息率来产生期望的语音质量。每种类型的参数编码器都为语音信号假设一个特殊的模型,该模型包括一些参数。在大多数情况中,参数模型被针对人类语音而高度最优化。参数编码器接收语音信号的样本,将样本放入模型,然后量化并编码这些值作为模型参数值。传输参数值而不是波形值使得参数编码器能高效工作。然而,当非声音信号存在或者除了声音还存在其它信号时,声音模型的最优化会造成问题。例如,当存在来自汽车环境的背景噪声时,很多参数编码器产生令人讨厌的可听人工痕迹。
由于重构语音中的这些人工痕迹对于听众来说可能不可接受,必须采用测量值来消除或至少减少背景噪声。一种方法是,使用噪声抑制设备作为语音编码器的预处理器。噪声抑制器从麦克风和其它的设备接收含噪声语音信号的样本,并处理这些样本,然后输出背景噪声电平降低的语音样本。输出样本是时域的,因此可以输入到语音编码器或直接送到数模转换器(DAC)设备来合成可听的语音。
用于噪声抑制的一种通常的方法是谱相减。在该方法中,背景噪声的模型和组合信号(或语音加噪声)的模型被用来构造线形噪声抑制滤波器。这些模型通常作为功率谱密度(PSDs)保持在频率域中。当声音活动检测器(VAD)表明语音存在或不存在时,噪声模型和组合模型被分别更新。噪声抑制输入样本被变换到频域,这些样本被施加噪声抑制滤波器,并且在输出到语音编码器和DAC之前,样本被变换回时域。
参数声音编码器可以进一步划分成时域和频域类型。大多数时域参数编码器基于包括线形预测系数(LPCs)的模型。代表性的频域类型是多波段激励(MBE)编码器,该编码器包括已知的IMBETM和AMBETM方法。MBE类编码器使用频率模型,该模型包括一些参数,如基频(或音调)、在基频和其谐波上计算的一组谱幅度、划分每个频段中清音或浊音能量的一组布尔值。一般地,在各个谱幅度和清/浊音判断之间存在一对一的对应关系。MBE类编码器通过分析语音信号样本帧或样本组来计算参数值。这些参数值然后被量化和编码用以传输或存储。
在仔细观察之后,在谱相减技术和例如上面描述的MBE类频域声音编码器之间存在清晰的类似性。两者都使用频率模型。实际上,在计算模型的频率方面和模型格式方面,这些模型可能非常相似。而且,两者的功能都不考虑输入信号的相位。谱相减输入和输出之间的相位是一样的,而频域解码器可以加上任意的相位,因为该信息并不在所发送的模型参数中。最后两种方法都使用了VAD,因为,可能很有利的是使编码器在不连续发送(DTX)模式下工作。该发明的目标是通过在频域语音编码器中引入谱相减噪声抑制来利用这些类似性。与使用噪声抑制器作为语音编码器预处理器相比,这种技术或设备复杂度明显很低。
发明概要
根据本发明,这里给出用于抑制声音编码器中噪声的方法。
概括来说,这里描述了一种集成有噪声抑制的用于对声音编码的系统,该系统包括一个采样器,它将模拟音频信号转换成时域音频样本帧。与采样器相连的声音活动检测器确定当前帧中是否存在语音。变换器与采样器相连用来将时域音频样本帧变换成频域表示。如果声音活动检测器确定不存在语音的话,与声音活动检测器和变换器相关的噪声模型调整器利用当前的音频帧来更新噪声模型。变换器和滤波器创建器创建噪声抑制滤波器。与变换器和噪声模型调整器相连的谱估计器从当前帧的频域表示中除去噪声特性,并推导出一组谱幅度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于艾利森公司,未经艾利森公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/98812990.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:制造沟槽动态随机存取存储器中电容器掩埋片的工艺
- 下一篇:涂覆缝纫线的方法





