[发明专利]一种基于相位调整和幅值补偿的多子带谱减法的语音增强方法有效
申请号: | 201210513075.0 | 申请日: | 2012-12-04 |
公开(公告)号: | CN103021420A | 公开(公告)日: | 2013-04-03 |
发明(设计)人: | 刘文举;李超 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G10L21/0232 | 分类号: | G10L21/0232 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 宋焰琴 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 相位 调整 补偿 多子带谱 减法 语音 增强 方法 | ||
1.一种基于相位调整和幅值补偿的多子带谱减法的语音增强方法,其特征在于,包括下列步骤:
步骤a:采集带噪语音信号y(k),获得所述带噪语音信号y(k)的幅值谱αy(ω),其中,k表示离散时间点,ω表示离散频点;
步骤b:利用相位调整算法对带噪语音的幅值谱进行微距最大值搜索,获得纯净语音信号与加性噪声信号之间的相位差为0时的带噪语音幅值谱
步骤c:利用噪声估计算法更新加性噪声幅值谱
步骤d:利用过减规则系数和加性噪声幅值谱 对所述带噪语音幅值谱 进行幅值谱减,得到纯净语音幅值谱
步骤e:利用二阶幅值补偿因子和预设的一阶幅值补偿因子,对纯净语音幅值谱 进行补偿,得到增强后的纯净语音幅值谱 进而得到增强后的纯净语音信号
2.如权利要求1所述的方法,其特征在于,所述步骤b中对带噪语音的幅值谱进行微距最大值搜索具体包括:
第ω频点上,在连续的M(ω)个时刻里搜索带噪语音信号幅值的最大值作为相位调整后的带噪语音幅值谱,即找到纯净语音信号与加性噪声信号之间的相位差为0时的带噪语音幅值谱:
其中,Ym(ω)是迁移m个采样点后语音信号的快速傅里叶变换,M(ω)在不同的频点上取值不同,如下式所示:
其中, 是向上取整算子,Ω表示快速傅里叶变换的长度,ω表示离散频点。
3.如权利要求1所述的方法,其特征在于,所述步骤c中更新加性噪声幅值谱 进一步包括:
步骤c1:计算全频带的信噪比SNR:
其中,log10表示自然对数算子,∑[·]是有限范围求和算子,k表示帧号,ω表示离散频点, 当前帧k的带噪语音功率谱的估计值, 表示前一帧k-1的加性噪声功率谱的估计值;
步骤c2:利用语音激活检测VAD方法,根据有声段的SNR的下限阈值SNRth,更新加性噪声功率谱的估计值:
其中, 表示前一帧k-1的加性噪声功率谱的估计值, 表示当前帧k的带噪语音功率谱的估计值,k是帧号。
步骤c3:根据所述加性噪声功率谱的估计值得到加性噪声幅值谱
4.如权利要求1所述的方法,其特征在于,所述步骤d前还包括将全频带划分成多个子频带,并在每个子频带上计算信噪比的步骤,其具体包括如下步骤:
步骤1:将全频带划分成多个子频带,并计算子频带带宽fd,
fd=fs/2R
其中,fs是采样率,R是子频带个数;
步骤2:计算各个子频带的起始频点br和截止频点er:
其中,r=1,2,...,R,Ω表示快速傅里叶变换的长度;
步骤3:计算第r个子频带上的信噪比SNRr,r=1,2,...,R:
其中,log10表示自然对数算子,∑[·]是有限范围求和算子,k表示帧号,ω表示离散频点, 表示当前帧k的带噪语音功率谱的估计值, 表示当前帧k的加性噪声功率谱的估计值。
5.如权利要求4所述的方法,其特征在于,所述步骤d中过减规则系数如下计算:
其中, 为各个子频带上的过减规则系数。
6.如权利要求5所述的方法,其特征在于,步骤d中所述幅值谱减如下:
在第r个子频带上进行谱减得到当前帧k的纯净语音幅值谱:
其中, 是当前帧k的加性噪声幅值谱, 是当前帧k的带噪语音幅值谱,r=1,2,...,R,δr是减法增益因子,计算公式如下:
7.如权利要求4所述的方法,其特征在于,步骤e中计算二阶幅值补偿因子具体如下:
计算各个子频带上二阶幅值补偿因子μ2,r;
其中,SNR0是判定是否有语音活动的阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210513075.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:大坝浇筑控制系统
- 下一篇:一种基于农业物联网试验田水况监测系统