[发明专利]使用语音信号的谐波估计噪声的方法和设备无效
申请号: | 200810085858.7 | 申请日: | 2008-03-21 |
公开(公告)号: | CN101271686A | 公开(公告)日: | 2008-09-24 |
发明(设计)人: | 金炫秀;高汉锡;安盛柱;裴正勋;尹现珍 | 申请(专利权)人: | 三星电子株式会社;高丽大学校产学协力团 |
主分类号: | G10L11/00 | 分类号: | G10L11/00;G10L11/02;G10L21/02;G10L15/20 |
代理公司: | 北京铭硕知识产权代理有限公司 | 代理人: | 郭鸿禧;韩素云 |
地址: | 韩国京畿道*** | 国省代码: | 韩国;KR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 语音 信号 谐波 估计 噪声 方法 设备 | ||
技术领域
本发明涉及声音信号处理,更具体地说,涉及一种用于估计包括在声音信号中的噪声的方法和设备。
背景技术
在用于语音通信或需要语音增强的语音识别的声音信号处理中,估计并去除包括在语音信号中的噪声很重要。因此,已经提出并使用用于估计噪声的方案。例如,为了估计噪声,一个方案首先在一定的时间间隔(即,时间段)估计噪声,在所述一定的时间间隔,在输入语音之前语音不存在,并且一旦输入语音,用于减少估计的噪声的信号被施加。在另一方案中,通过使用语音激活检测(VAD)将非语音和语音区进行区分,并随后在非语音时间段估计噪声。还存在一种基于最小统计量的噪声估计方案,其中,基于在语音时间段中的语音频谱能量大于噪声的频谱能量以及语音字的发音时间段与0.7秒至1.3秒相应的特性,在给定时间段中表示最小能量的值被估计为是噪声。在另一方案中通过关于语音是否存在的概率进行近似确定,以在语音存在概率(VPP)较大的时间段期间估计噪声,相反,在VPP较小的时间段期间不估计噪声。
然而,上述传统噪声估计方案的缺陷在于它们不能够检测非平稳噪声的改变,以反映噪声估计的改变。例如,不能有效地估计具有较短持续时间、但是还具有与语音能量类似的大能量的错误噪声(诸如,在实际生活中突然产生的周围的音频声音或包括关门时产生的声音、脚步声等的噪声)。因此,出现的问题在于错误噪声估计导致残留噪声的问题。残留噪声导致在语音通信中用户收听不方便或语音识别装置的故障,这使语音识别产品的性能下降。
传统噪声估计方案具有上述问题的原因在于:当参照在先前处理的语音时间段中的结果处理随后语音信号的方案时,在相关时间段可存在与先前噪声不同的噪声,当通过近似预测噪声存在的时间段仅在相关时间段期间估计噪声的方案时,准确地估计噪声存在的时间段存在限制。而且,由于通过使用各个信号的能量大小之间的差与信噪比(SNR)对语音和非语音进行区分的方案,即,当如果诸如各个信号的能量大小之间的差与信噪比(SNR)的值较大,则识别时间段为语音时间段的方案时,以及当如果该值较小,则将时间段看作非语音时间段的方案时,如果具有与语音的能量的大小类似的大小的能量的周围噪声被输入,则噪声估计没有被实现,因此,噪声频谱没有被更新。
发明内容
因此,本发明致力于解决上述发生在传统方法中的问题,并且本发明提供一种在语音信号处理中估计非平稳噪声并去除估计的非平稳噪声的方法和设备。
而且,本发明提供一种用于估计具有与语音能量的大小类似的大小的能量的噪声并去除估计的噪声的方法和设备。
此外,本发明提供一种有效地估计噪声并去除估计的噪声的方法和设备。
根据本发明的一方面,提供一种通过使用语音信号的谐波来估计噪声的方法,包括:在输入声音信号的帧中估计谐波分量;使用估计的谐波分量,计算关于输入的声音信号的帧的语音存在概率(VPP);根据计算的VPP,确定如下定义的估计噪声频谱所需的等式的权值;以及使用确定的权值和估计噪声频谱所需的等式,估计噪声频谱,并更新噪声频谱,
N(k,t)=α(k,t)N(k,t-1)+(1-α(k,t))Y(k,t),
其中,N(k,t)表示噪声频谱,Y(k,t)表示输入信号的频谱,索引k表示频率索引,索引t表示帧索引,以及α(k,t)表示权值。
根据本发明的另一方面,提供一种通过使用语音信号的谐波估计噪声的设备,包括:谐波估计单元,估计在输入声音信号的帧中的谐波分量,并输出估计的谐波分量;语音估计单元,使用估计的谐波分量,计算关于输入声音信号的帧的语音存在概率(VPP),并输出计算的VPP;权值确定单元,根据计算的VPP,确定如下定义的估计噪声谱所需的等式的权值,并输出确定的权值;以及噪声频谱更新单元,使用确定的权值和估计噪声频谱所需的等式,估计噪声频谱,并更新噪声频谱,
N(k,t)=α(k,t)N(k,t-1)+(1-α(k,t))Y(k,t),
其中,N(k,t)表示噪声频谱,Y(k,t)表示输入信号的频谱,索引k表示频率索引,索引t表示帧索引,以及α(k,t)表示权值。
附图说明
通过下面结合附图的详细描述,本发明的上述和其他示例性特点、方面和优点将会变得更加清楚,其中:
图1是示出根据本发明的实施例的用于估计噪声的设备的配置的框图;
图2是示出根据本发明的实施例的估计噪声的处理的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社;高丽大学校产学协力团,未经三星电子株式会社;高丽大学校产学协力团许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810085858.7/2.html,转载请声明来源钻瓜专利网。