[发明专利]一种适用于噪声环境下的语音识别方法在审
| 申请号: | 201910581762.8 | 申请日: | 2019-06-30 |
| 公开(公告)号: | CN110148420A | 公开(公告)日: | 2019-08-20 |
| 发明(设计)人: | 曾庆宁;卜玉婷;刘伟波 | 申请(专利权)人: | 桂林电子科技大学 |
| 主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L15/22;G10L25/30;G10L25/24 |
| 代理公司: | 桂林市华杰专利商标事务所有限责任公司 45112 | 代理人: | 杨雪梅 |
| 地址: | 541004 广*** | 国省代码: | 广西;45 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音信号 噪声环境 语音识别 去噪 波束形成 畸变 语音 卷积神经网络 波束形成器 计算复杂度 对角 矩阵求逆 微麦克风 语音模型 语音设备 智能音箱 最小方差 调制域 稳健性 递归 构建 后置 加载 减法 去除 噪声 机器人 采集 残留 响应 应用 | ||
1.一种适用于噪声环境下的语音识别方法,其特征在于,包括如下步骤:
1)采集双微麦克风阵列语音信号,并对采集的语音信号建立如下形式模型:
ym(t)=xm(t)+nm(t) m= 1,2,...,M (1)
上述公式(1)中,M表示麦克风数量,xm(t)表示纯净语音信号,nm(t)表示加性的噪声和干扰信号,ym(t)表示含噪语音信号;
2)对步骤1)采集到的含噪语音信号进行傅里叶变换,得到频域,频域表达式为:
Y(l,k)=X(l,k)+N(l,k) (2)
上述公式(2)中,X(l,k)表示原始纯净语音信号频谱,N(l,k)表示噪声信号频谱,Y(l,k)表示含噪语音信号,l是时间索引,k是频率索引;
3)构建综合最小方差无畸变响应波束形成与对角加载的双微阵列语音波束形成器,并利用递归矩阵求逆的方法减少了原先大量矩阵求逆运算导致的计算复杂度,求得波束形成器的复数加权系数,将步骤2)中的麦克风阵列信号的矢量系数与波束形成器求得的复数加权系数相乘,得到麦克风阵列初步去噪的语音信号;
4)在构建的双微阵列语音波束形成器之后,后置调制域谱减法,对步骤3)得到的经麦克风阵列初步去噪的语音信号的目标声源方向进行处理,进一步去除噪声残留及语音畸变,提高语音的可懂度,得到最终去噪后的语音信号;
5)对步骤4)得到的最终去噪后的语音信号,提取梅尔频率倒谱系数及其一阶、二阶导数共39维,作为特征参数,并输入到通过卷积神经网络模型训练的语音识别系统中进行识别。
2.根据权利要求1所述的一种适用于噪声环境下语音识别方法,其特征在于,所述的步骤3),具体包括如下步骤:
3-1)最小方差无畸变响应(Minimum Variance Distortionless Response,MVDR)满足以下约束优化问题:
上述公式(3),Rn是噪声协方差矩阵,w是波束形成器的加权系数,wH是加权系数的共轭转置,D(k)是期望语音信号导向矢量,采用Lagrange乘子法,定义函数:
上述公式(4)中,λ≥0,是Lagrange乘子,Rn是噪声协方差矩阵;
3-2)将3-1)中的函数对w求导,并令该导数为0,得到:
进行求解得到加权向量的值为:
3-3)将3-2)中求得的W代入步骤3-1)的约束条件中,求得:
其中,上式的D(k)表示期望信号导向矢量,DH(k)表示期望信号导向矢量的共轭转置,为噪声信号协方差矩阵的逆矩阵,进而可求出最优加权向量为
3-4)将步骤3-3)中的麦克风阵列信号的矢量系数与求得的最优加权向量WMVDR相乘,可得到麦克风阵列初步去噪的语音信号;
3-5)引入对角加载的方法,抑制步骤3-3)中的协方差矩阵Rn中小特征值扰动造成偏差的输出性能的影响:
上述公式(8)中,为对角加载后噪声信号的协方差矩阵,ε为对角加载量,Rn为进行对角加载前的噪声信号的协方差矩阵,I为单位矩阵,将协方差矩阵进行对角加载抑制非相关噪声,其中的协方差矩阵为:
得到对角加载后的权向量为:
3-6)为了减少MVDR波束形成器中的加权向量,通过对协方差矩阵进行求逆运算导致的计算复杂度较高的问题,采用递推算法,减少矩阵求逆运算量,假设在空域滤波结构中,噪声与语音信号相互独立,含噪语音信号的功率谱密度为Φy=E(YYH),且满足有Φy=Φx+Φn;
3-7)对功率谱密度在时间上求平均进行估计:
上述公式(11)中,Φn为噪声的功率谱密度,Φx+n为含噪语音的功率谱密度;αn和αx为固定常数,通过以下步骤3-8)求得;
3-8)αn和αx表达式为:
对含噪语音端点检测,当检测到语音帧时μx=1,噪声帧时μx=0,其中根据矩阵求逆引理,相关矩阵求逆运算后可表示为:
3-9)对步骤3-8)进一步简化,令最后递推得到MVDR波束形成器的加权向量为:
3-10)将求得的递归矩阵求逆的MVDR的权值矢量系数与含噪双微阵列语音信号的频谱相乘即得到进行波束形成去噪后的语音信号为:
经过上述步骤,可以得到麦克风阵列初步去噪的语音信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910581762.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于深度学习的语音分离方法
- 下一篇:一种残余回声检测方法、终端和装置





