[发明专利]一种适用于噪声环境下的语音识别方法在审
申请号: | 201910581762.8 | 申请日: | 2019-06-30 |
公开(公告)号: | CN110148420A | 公开(公告)日: | 2019-08-20 |
发明(设计)人: | 曾庆宁;卜玉婷;刘伟波 | 申请(专利权)人: | 桂林电子科技大学 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L15/22;G10L25/30;G10L25/24 |
代理公司: | 桂林市华杰专利商标事务所有限责任公司 45112 | 代理人: | 杨雪梅 |
地址: | 541004 广*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种适用于噪声环境下的语音识别方法,该方法对经双微麦克风阵列采集的含噪语音信号构建综合了最小方差无畸变响应波束形成与对角加载的波束形成器,并利用递归矩阵求逆的方法减少计算复杂度,得到进行波束形成后初步去噪的语音信号;再后置调制域谱减法对初步去噪后的语音信号做进一步处理,去除残留的噪声并减少语音畸变,得到最终去噪处理后的语音信号;另外本发明方法采用卷积神经网络进行语音模型的训练,提取语音深层次的特征。该发明方法解决了噪声环境下语音识别率下降的问题,具有较好的稳健性,可应用在家居机器人,智能音箱以及噪声环境下工作的语音设备等方面。 | ||
搜索关键词: | 语音信号 噪声环境 语音识别 去噪 波束形成 畸变 语音 卷积神经网络 波束形成器 计算复杂度 对角 矩阵求逆 微麦克风 语音模型 语音设备 智能音箱 最小方差 调制域 稳健性 递归 构建 后置 加载 减法 去除 噪声 机器人 采集 残留 响应 应用 | ||
【主权项】:
1.一种适用于噪声环境下的语音识别方法,其特征在于,包括如下步骤:1)采集双微麦克风阵列语音信号,并对采集的语音信号建立如下形式模型:ym(t)=xm(t)+nm(t) m= 1,2,...,M (1)上述公式(1)中,M表示麦克风数量,xm(t)表示纯净语音信号,nm(t)表示加性的噪声和干扰信号,ym(t)表示含噪语音信号;2)对步骤1)采集到的含噪语音信号进行傅里叶变换,得到频域,频域表达式为:Y(l,k)=X(l,k)+N(l,k) (2)上述公式(2)中,X(l,k)表示原始纯净语音信号频谱,N(l,k)表示噪声信号频谱,Y(l,k)表示含噪语音信号,l是时间索引,k是频率索引;3)构建综合最小方差无畸变响应波束形成与对角加载的双微阵列语音波束形成器,并利用递归矩阵求逆的方法减少了原先大量矩阵求逆运算导致的计算复杂度,求得波束形成器的复数加权系数,将步骤2)中的麦克风阵列信号的矢量系数与波束形成器求得的复数加权系数相乘,得到麦克风阵列初步去噪的语音信号;4)在构建的双微阵列语音波束形成器之后,后置调制域谱减法,对步骤3)得到的经麦克风阵列初步去噪的语音信号的目标声源方向进行处理,进一步去除噪声残留及语音畸变,提高语音的可懂度,得到最终去噪后的语音信号;5)对步骤4)得到的最终去噪后的语音信号,提取梅尔频率倒谱系数及其一阶、二阶导数共39维,作为特征参数,并输入到通过卷积神经网络模型训练的语音识别系统中进行识别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910581762.8/,转载请声明来源钻瓜专利网。
- 上一篇:基于深度学习的语音分离方法
- 下一篇:一种残余回声检测方法、终端和装置