[发明专利]一种抗噪声干扰的浊语音检测方法及系统有效
申请号: | 201210056627.X | 申请日: | 2012-03-06 |
公开(公告)号: | CN103310800A | 公开(公告)日: | 2013-09-18 |
发明(设计)人: | 国雁萌;李凯;姜开宇;付强;颜永红 | 申请(专利权)人: | 中国科学院声学研究所;北京中科信利技术有限公司 |
主分类号: | G10L25/93 | 分类号: | G10L25/93;G10L21/0232 |
代理公司: | 北京法思腾知识产权代理有限公司 11318 | 代理人: | 杨小蓉;杨青 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 噪声 干扰 语音 检测 方法 系统 | ||
技术领域
本发明涉及一种浊语音检测方法。更具体地说,本发明提出了一种抗噪声干扰的浊语音检测方法及系统。
背景技术
随着语音信号处理系统的应用日益广泛,背景噪声干扰问题变得越来越严重。对语音信号和背景噪声进行区别,并将噪声拒绝在语音信号处理系统之外,是减少背景噪声干扰的最直接和有效手段。由于语音信号是由清音和浊音共同组成的,其中浊音信号在时长和能量方面占据了绝对的优势,所以,一般可以通过检测浊音信号实现语音/噪声的初步判决。
浊音是由周期性的声门脉冲激励声道而产生的,其中声门脉冲的振动频率即基音频率。因此,浊音信号在基音频率和基音的整数倍频上都具有较高的能量,而在其它频率上的能量则明显较低。由于基音频率是连续缓变的,所以如果对浊音进行短时频谱分析,则相邻帧之间的基音频率和谐波频率都比较接近,并可连接为类似梳状的一系列连续谐波谱线,这就是浊音信号特有的谐波结构。
浊语音的检测方法主要包括基于基频周期性和基于谐波特性两类。其中,基于周期性的方法主要通过信号自相关判断信号是否具有周期性,基于谐波特性的方法则利用信号在频域上均匀分布的能量极值点作为检测依据,如谐波能量和、最小二乘周期估计(LSPE)等。但是,这些方法利用的是全频带或固定频带的信息,而实际噪声的频谱能量分布往往是时变的,所以这些方法不适合用于实际环境中的浊语音检测。
发明内容
本发明的目的在于,为克服现有浊语音的检测方法的诸多缺陷,提供一种抗噪声干扰的浊语音检测方法及系统。
为实现上述目的,本发明提供了一种抗噪声干扰的浊语音检测方法,该方法基于谐波与背景的能量比确定是否存在浊音,并随着干扰噪声的不同,自动的找到频率范围中谐波结构最清晰的频带范围,而忽略受到噪声干扰的频带,所述方法包含:
步骤101)针对人类语音的基音频率范围,建立若干基音频率按对数尺度变化的谐波模板;
步骤102)基于上步骤的模板,每帧信号与模板的匹配过程均包括若干次能量范围选择,使某受到干扰的频率范围得到忽略;
步骤103)利用多帧信号基音频率的连续性,进行浊语音存在性判决,从而最终确定一段信号中是否包含浊语音。
上述技术方案中,所述步骤101)进一步包含如下子步骤:
步骤201)对输入的单通道声音信号进行短时傅里叶变换,获得每帧信号在N个离散频率点上的对数能量,其中N是2的整数次幂;
步骤202)根据人类语音的基音频率范围,及输入信号的频率范围,计算M个谐波结构模板,用于对信号的能量谱进行比对;其中,每个谐波模板是一组频率值,代表了一个基频和其对应的一系列谐波和非谐波频率,通过把各频率值舍入到最近的离散频率点,每个模板都把N个离散频率点区分为谐波和非谐波两类,且M个模板的基频是以对数步长增长的,基频越低,相邻两个模板之间基频差距越小。
所述步骤102)对每一帧输入信号的离散频谱能量,用M个模板与之相比对,每一个模板的比对方法如下,以第j个模板进行说明,其中j=1..M:
301)对第j个模板,其中包含A个谐波频率和B个非谐波频率,将该帧信号在各谐波频率上的各频点按能量从大到小排列,非谐波频率上的各频点也按照能量从大到小排列;
302)对第j个模板,设定一个比例因子α1,根据所有谐波频点的能量大小,排除能量最高的[α1A]个谐波频率点和能量最低的[α1A]个谐波频率点,并计算其余谐波频率点上能量的平均值;按同样方法将所有非谐波频率上能量最高的[α1B]和最低的[α1B]部分去掉,并计算其余非谐波频率上能量的平均值,
其中,[]表示取整运算,将谐波平均能量和非谐波平均能量的比值记为R1;0<α1<0.3;
303)按照步骤302)的方法,以不同的比例α2~αk分别去掉部分能量最高和最低的谐波和非谐波频率,并计算谐波与非谐波的平均能量之比R2~Rk,上述的k个参数αi取值范围都在0到0.3之间,i=1..k,且两两不相等;
304)选择R1~Rk中的最大值作为该帧信号与第j个模板的匹配值Qj;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;北京中科信利技术有限公司,未经中国科学院声学研究所;北京中科信利技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210056627.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:吊扇底壳轴承拆卸工具
- 下一篇:一种航空液压油增粘剂及其合成方法