[发明专利]一种基于相位调整和幅值补偿的多子带谱减法的语音增强方法有效

申请号：	201210513075.0	申请日：	2012-12-04
公开（公告）号：	CN103021420A	公开（公告）日：	2013-04-03
发明（设计）人：	刘文举;李超	申请（专利权）人：	中国科学院自动化研究所
主分类号：	G10L21/0232	分类号：	G10L21/0232
代理公司：	中科专利商标代理有限责任公司 11021	代理人：	宋焰琴
地址：	100190 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于相位调整补偿多子带谱减法语音增强方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于相位调整和幅值补偿的多子带谱减法的语音增强方法，其特征在于，包括下列步骤：

步骤a：采集带噪语音信号y(k)，获得所述带噪语音信号y(k)的幅值谱α_y(ω)，其中，k表示离散时间点，ω表示离散频点；

步骤b：利用相位调整算法对带噪语音的幅值谱进行微距最大值搜索，获得纯净语音信号与加性噪声信号之间的相位差为0时的带噪语音幅值谱

步骤c：利用噪声估计算法更新加性噪声幅值谱

步骤d：利用过减规则系数和加性噪声幅值谱对所述带噪语音幅值谱进行幅值谱减，得到纯净语音幅值谱

步骤e：利用二阶幅值补偿因子和预设的一阶幅值补偿因子，对纯净语音幅值谱进行补偿，得到增强后的纯净语音幅值谱进而得到增强后的纯净语音信号

2.如权利要求1所述的方法，其特征在于，所述步骤b中对带噪语音的幅值谱进行微距最大值搜索具体包括：

第ω频点上，在连续的M(ω)个时刻里搜索带噪语音信号幅值的最大值作为相位调整后的带噪语音幅值谱，即找到纯净语音信号与加性噪声信号之间的相位差为0时的带噪语音幅值谱：

其中，Y_m(ω)是迁移m个采样点后语音信号的快速傅里叶变换，M(ω)在不同的频点上取值不同，如下式所示：

其中，是向上取整算子，Ω表示快速傅里叶变换的长度，ω表示离散频点。

3.如权利要求1所述的方法，其特征在于，所述步骤c中更新加性噪声幅值谱进一步包括：

步骤c1：计算全频带的信噪比SNR：

其中，log₁₀表示自然对数算子，∑[·]是有限范围求和算子，k表示帧号，ω表示离散频点，当前帧k的带噪语音功率谱的估计值，表示前一帧k-1的加性噪声功率谱的估计值；

步骤c2：利用语音激活检测VAD方法，根据有声段的SNR的下限阈值SNR_th，更新加性噪声功率谱的估计值：

其中，表示前一帧k-1的加性噪声功率谱的估计值，表示当前帧k的带噪语音功率谱的估计值，k是帧号。

步骤c3：根据所述加性噪声功率谱的估计值得到加性噪声幅值谱

4.如权利要求1所述的方法，其特征在于，所述步骤d前还包括将全频带划分成多个子频带，并在每个子频带上计算信噪比的步骤，其具体包括如下步骤：

步骤1：将全频带划分成多个子频带，并计算子频带带宽f_d，

f_d＝f_s/2R

其中，f_s是采样率，R是子频带个数；

步骤2：计算各个子频带的起始频点b_r和截止频点e_r：

其中，r＝1，2，...，R，Ω表示快速傅里叶变换的长度；

步骤3：计算第r个子频带上的信噪比SNR_r，r＝1，2，...，R：

其中，log₁₀表示自然对数算子，∑[·]是有限范围求和算子，k表示帧号，ω表示离散频点，表示当前帧k的带噪语音功率谱的估计值，表示当前帧k的加性噪声功率谱的估计值。

5.如权利要求4所述的方法，其特征在于，所述步骤d中过减规则系数如下计算：

其中，为各个子频带上的过减规则系数。

6.如权利要求5所述的方法，其特征在于，步骤d中所述幅值谱减如下：

在第r个子频带上进行谱减得到当前帧k的纯净语音幅值谱：

其中，是当前帧k的加性噪声幅值谱，是当前帧k的带噪语音幅值谱，r＝1，2，...，R，δ_r是减法增益因子，计算公式如下：

7.如权利要求4所述的方法，其特征在于，步骤e中计算二阶幅值补偿因子具体如下：

计算各个子频带上二阶幅值补偿因子μ_2，r；

其中，SNR₀是判定是否有语音活动的阈值。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所，未经中国科学院自动化研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201210513075.0/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载