[发明专利]一种广义最大后验的谱幅度估计的增益函数语音增强方法有效
| 申请号: | 201710880953.5 | 申请日: | 2017-09-26 |
| 公开(公告)号: | CN107731242B | 公开(公告)日: | 2020-09-04 |
| 发明(设计)人: | 曾庆宁;肖强;王瑶 | 申请(专利权)人: | 桂林电子科技大学 |
| 主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L19/02;G10L25/21 |
| 代理公司: | 桂林市华杰专利商标事务所有限责任公司 45112 | 代理人: | 周雯 |
| 地址: | 541004 广西*** | 国省代码: | 广西;45 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 广义 最大 幅度 估计 增益 函数 语音 增强 方法 | ||
1.一种广义最大后验的谱幅度估计的增益函数语音增强方法,其特征在于,包括如下步骤:
1)建立含噪语音模型,所述含噪语音信号表示为:
y(n)=s(n)+v(n) (1)
y(n)表示含噪语音;s(n)表示纯净语音;v(n)表示噪声;
2)由步骤1)对麦克风接收到的含噪语音进行短时傅里叶变换,获得含噪语音的频域,
Y(uw)=S(u,w)+V(u,w) (2)
式中,u表示帧数;w表示频率;
3)由步骤2)利用含噪语音的频域估计含噪语音的功率谱,采用一阶递归的功率谱估计,
P(u,w)=αP(u-1,w)+(1-α)|Y(u,w)|2 (3);
4)利用步骤3)得到的含噪语音的功率谱,计算一段含噪语音帧的含噪语音最小功率谱,即在局部搜索窗长内搜索含噪语音功率谱来计算最小功率谱,得到:
Pmin(u,w)=min{P(n,w),P(u-1,w),…P(u-D+1,w) (4)
式中Pmin(u,w)含噪语音最小功率谱,Pmin(u,w)的计算是基于P(u,w)在{u,u-1,…u-D+1}上计算,其中D为过去帧的帧数;
5)由步骤4)得到的Pmin(u,w)总会小于噪声平均值,利用无偏修正因子Bmin(u,w)进行修正噪声功率谱,而无偏修正因子与步骤4)中过去帧数D有关,Bmin(u,w)的值会随着D的变化而变化,通过渐进求取的方法计算无偏修正因子Bmin(u,w)的近似值,Bmin(u,w)表示为:
6)步骤6)中:利用步骤4)与步骤5)得到的含噪语音最小功率谱及无偏因子估计噪声功率谱,噪声功率谱估计值由含噪语音的最小功率谱与无偏因子的乘积获得,因此噪声功率谱估计值为:
Pv(u,w)=Pmin(u,w)Bmin(u,w) (6);
7)通过步骤3)得到的含噪语音的功率谱与步骤6)得到的噪声功率谱获得后验信噪比以及通过后验信噪比获得先验信噪比,
式中:γ(u,w)为后验信噪比;ξ(u,w)为先验信噪比;PS(u,w)为纯净语音功率谱估计值,引入平滑因子λ,通过前一帧的先验信噪比及当前帧的后验信噪比获得当前帧的先验信噪比,
ξ(u,w)=λξ(u-1,w)+(1-λ)(γ(u,w)-1) (9);
8)通过最大后验的谱估计推导增益函数,利用步骤7)获得的先验信噪比计算增益函数值;由广义最大后验的谱幅度估计推导增益函数:
式中:Sk=|S(u,w)|为纯净语音的幅度;JGMAPA(Sk)是最大后验的代价函数,定义为:
JGMAPA(Sk)=ln{p(Y|Sk)[p(Sk)]η} (11)
式中:p(Y|Sk)表示最大似然;p(Sk)是由瑞利分布建模的表示先验概率;
假设含噪语音与纯净语音的的幅度谱不相关,p(Y|Sk)表示为
式中:Yk=|Y(u,w)|表示含噪语音的幅度;σV2=PV(u,w)表示噪声幅度,
因此代价函数表示为:
上式中σS2表示PS(u,w),
对代价函数求导,使其得出:
式中:ξ表示ξ(u,w);γ表示γ(u,w),
因此增益函数为:
9)利用步骤8)得到的增益函数、步骤7)的先验信噪比以及步骤2)含噪语音的频域得出纯净语音的估计值:
S(u,w)=G(u,w)Y(u,w) (16);
通过上述步骤就能得到基于广义最大后验的谱幅度估计的增益函数的增强语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710880953.5/1.html,转载请声明来源钻瓜专利网。





