[发明专利]一种面向瞬态噪声抑制的实时语音增强方法有效

申请号：	201911035076.7	申请日：	2019-10-28
公开（公告）号：	CN110739005B	公开（公告）日：	2022-02-01
发明（设计）人：	王青云;梁瑞宇;谢跃;唐闺臣;包永强;冯月芹;何超	申请（专利权）人：	南京工程学院
主分类号：	G10L21/0232	分类号：	G10L21/0232;G10L21/0264;G10L21/0332;G10L25/03
代理公司：	南京瑞弘专利商标事务所(普通合伙) 32249	代理人：	徐激波
地址：	211167 江苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种面向瞬态噪声抑制实时语音增强方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种面向瞬态噪声抑制的实时语音增强方法，其特征在于，包括以下步骤：

步骤1)、对含噪语音进行分帧和加窗预处理，求出幅度谱；

步骤2)、采用分位噪声估计法获得稳态噪声谱；

步骤3)、采用基于信号重心检测法来获得瞬态噪声，并根据是否存在瞬态噪声来修正稳态噪声谱；

步骤4)、采用基于语音特征的方法估计语音存在概率一；

步骤5)、采用谐波分析的方法估计语音存在概率二；

步骤6)、综合步骤4)和步骤5)获得的两个语音存在概率，计算增益，并进行语音增强；

其中，所述步骤5)中的基于谐波分析的语音概率二的计算步骤为：

步骤5.1)通过短时傅里叶变换后的窗函数来构造出激励谱，公式为：

式中，为窗函数的短时傅里叶变换，t_k是基音周期对应的频点，i为谐波带的索引，Q为总谐波子带数，l和k分别表示步骤3)获得的稳态噪声谱中的第l帧k频点噪声；

步骤5.2)、计算拟合系数

步骤5.3)、计算信号拟合误差为：

式中，a_i和b_i代表谐波频带的区间且a_i＝(i-0.5)t_k，b_i＝(i+0.5)t_k；

步骤5.4)、使用误差最小的η_i(l)和激励谱χ(k,l)拟合出符合当前帧的谐波，公式表示为：

步骤5.5)、结合似然比Δ(k,l)，基于谐波的语音存在概率为：

其中，

所述步骤6)中的综合两个语音概率计算增益，并进行语音增强的步骤为：

步骤6.1)、基于步骤4)和步骤5)中获得的两个语音存在概率，计算得到最终的语音存在概率为：

p(k,l)＝τq_F(k,l)+(1-τ)p_M(k,l) (23)

其中，τ为加权因子；q_F为步骤4)计算获得的概率一；

步骤6.2)、根据最终的语音存在概率、各频点的语音信号的幅值，计算当前帧的估计的噪声谱：

X(k，l)表示观测到第l帧信号的能量；

步骤6.3)、与上一帧噪声谱进行平滑，得到平滑后的当前帧的估计的噪声谱：

式中，T_N为语音存在可能性阈值；噪声平滑系数ξ_N相对于语音平滑系数ξ_X较小；

根据估计的噪声重新求出后验信噪比和先验信噪比

步骤6.4)、根据经过调整的后验信噪比和先验信噪比计算增益函数，结合增益函数、调整前的后验信噪比和先验信噪比，获得增强后的信号；增强后的信号为：

其中，G_H1(k,l)表示增益函数，定义为

式中,G_min(k,l)代表着抑制噪声的最大系数。

2.根据权利要求1所述的一种面向瞬态噪声抑制的实时语音增强方法，其特征在于：所述的步骤2)中分位噪声估计方法的步骤包括

步骤2.1)、根据幅度谱上各频点的分位数，引入最大抑制值，计算噪声信号抑制因子；

步骤2.2)、根据幅度谱上各频点的分位数噪声幅度值、各频点的语音信号的幅值和噪声信号抑制因子，引入权衡因子，更新分位数噪声幅值，估计得到分位数噪声；

步骤2.3)、估计的噪声和实际频谱幅度的差异性参数，更新分位数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京工程学院，未经南京工程学院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201911035076.7/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载