[发明专利]一种面向瞬态噪声抑制的实时语音增强方法有效
申请号: | 201911035076.7 | 申请日: | 2019-10-28 |
公开(公告)号: | CN110739005B | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 王青云;梁瑞宇;谢跃;唐闺臣;包永强;冯月芹;何超 | 申请(专利权)人: | 南京工程学院 |
主分类号: | G10L21/0232 | 分类号: | G10L21/0232;G10L21/0264;G10L21/0332;G10L25/03 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 徐激波 |
地址: | 211167 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 瞬态 噪声 抑制 实时 语音 增强 方法 | ||
1.一种面向瞬态噪声抑制的实时语音增强方法,其特征在于,包括以下步骤:
步骤1)、对含噪语音进行分帧和加窗预处理,求出幅度谱;
步骤2)、采用分位噪声估计法获得稳态噪声谱;
步骤3)、采用基于信号重心检测法来获得瞬态噪声,并根据是否存在瞬态噪声来修正稳态噪声谱;
步骤4)、采用基于语音特征的方法估计语音存在概率一;
步骤5)、采用谐波分析的方法估计语音存在概率二;
步骤6)、综合步骤4)和步骤5)获得的两个语音存在概率,计算增益,并进行语音增强;
其中,所述步骤5)中的基于谐波分析的语音概率二的计算步骤为:
步骤5.1)通过短时傅里叶变换后的窗函数来构造出激励谱,公式为:
式中,为窗函数的短时傅里叶变换,tk是基音周期对应的频点,i为谐波带的索引,Q为总谐波子带数,l和k分别表示步骤3)获得的稳态噪声谱中的第l帧k频点噪声;
步骤5.2)、计算拟合系数
步骤5.3)、计算信号拟合误差为:
式中,ai和bi代表谐波频带的区间且ai=(i-0.5)tk,bi=(i+0.5)tk;
步骤5.4)、使用误差最小的ηi(l)和激励谱χ(k,l)拟合出符合当前帧的谐波,公式表示为:
步骤5.5)、结合似然比Δ(k,l),基于谐波的语音存在概率为:
其中,
所述步骤6)中的综合两个语音概率计算增益,并进行语音增强的步骤为:
步骤6.1)、基于步骤4)和步骤5)中获得的两个语音存在概率,计算得到最终的语音存在概率为:
p(k,l)=τqF(k,l)+(1-τ)pM(k,l) (23)
其中,τ为加权因子;qF为步骤4)计算获得的概率一;
步骤6.2)、根据最终的语音存在概率、各频点的语音信号的幅值,计算当前帧的估计的噪声谱:
X(k,l)表示观测到第l帧信号的能量;
步骤6.3)、与上一帧噪声谱进行平滑,得到平滑后的当前帧的估计的噪声谱:
式中,TN为语音存在可能性阈值;噪声平滑系数ξN相对于语音平滑系数ξX较小;
根据估计的噪声重新求出后验信噪比和先验信噪比
步骤6.4)、根据经过调整的后验信噪比和先验信噪比计算增益函数,结合增益函数、调整前的后验信噪比和先验信噪比,获得增强后的信号;增强后的信号为:
其中,GH1(k,l)表示增益函数,定义为
式中,Gmin(k,l)代表着抑制噪声的最大系数。
2.根据权利要求1所述的一种面向瞬态噪声抑制的实时语音增强方法,其特征在于:所述的步骤2)中分位噪声估计方法的步骤包括
步骤2.1)、根据幅度谱上各频点的分位数,引入最大抑制值,计算噪声信号抑制因子;
步骤2.2)、根据幅度谱上各频点的分位数噪声幅度值、各频点的语音信号的幅值和噪声信号抑制因子,引入权衡因子,更新分位数噪声幅值,估计得到分位数噪声;
步骤2.3)、估计的噪声和实际频谱幅度的差异性参数,更新分位数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工程学院,未经南京工程学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911035076.7/1.html,转载请声明来源钻瓜专利网。