[发明专利]一种适用于噪声环境下的语音识别方法在审

专利信息
申请号: 201910581762.8 申请日: 2019-06-30
公开(公告)号: CN110148420A 公开(公告)日: 2019-08-20
发明(设计)人: 曾庆宁;卜玉婷;刘伟波 申请(专利权)人: 桂林电子科技大学
主分类号: G10L21/0208 分类号: G10L21/0208;G10L15/22;G10L25/30;G10L25/24
代理公司: 桂林市华杰专利商标事务所有限责任公司 45112 代理人: 杨雪梅
地址: 541004 广*** 国省代码: 广西;45
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种适用于噪声环境下的语音识别方法,该方法对经双微麦克风阵列采集的含噪语音信号构建综合了最小方差无畸变响应波束形成与对角加载的波束形成器,并利用递归矩阵求逆的方法减少计算复杂度,得到进行波束形成后初步去噪的语音信号;再后置调制域谱减法对初步去噪后的语音信号做进一步处理,去除残留的噪声并减少语音畸变,得到最终去噪处理后的语音信号;另外本发明方法采用卷积神经网络进行语音模型的训练,提取语音深层次的特征。该发明方法解决了噪声环境下语音识别率下降的问题,具有较好的稳健性,可应用在家居机器人,智能音箱以及噪声环境下工作的语音设备等方面。
搜索关键词: 语音信号 噪声环境 语音识别 去噪 波束形成 畸变 语音 卷积神经网络 波束形成器 计算复杂度 对角 矩阵求逆 微麦克风 语音模型 语音设备 智能音箱 最小方差 调制域 稳健性 递归 构建 后置 加载 减法 去除 噪声 机器人 采集 残留 响应 应用
【主权项】:
1.一种适用于噪声环境下的语音识别方法,其特征在于,包括如下步骤:1)采集双微麦克风阵列语音信号,并对采集的语音信号建立如下形式模型:ym(t)=xm(t)+nm(t) m= 1,2,...,M   (1)上述公式(1)中,M表示麦克风数量,xm(t)表示纯净语音信号,nm(t)表示加性的噪声和干扰信号,ym(t)表示含噪语音信号;2)对步骤1)采集到的含噪语音信号进行傅里叶变换,得到频域,频域表达式为:Y(l,k)=X(l,k)+N(l,k)   (2)上述公式(2)中,X(l,k)表示原始纯净语音信号频谱,N(l,k)表示噪声信号频谱,Y(l,k)表示含噪语音信号,l是时间索引,k是频率索引;3)构建综合最小方差无畸变响应波束形成与对角加载的双微阵列语音波束形成器,并利用递归矩阵求逆的方法减少了原先大量矩阵求逆运算导致的计算复杂度,求得波束形成器的复数加权系数,将步骤2)中的麦克风阵列信号的矢量系数与波束形成器求得的复数加权系数相乘,得到麦克风阵列初步去噪的语音信号;4)在构建的双微阵列语音波束形成器之后,后置调制域谱减法,对步骤3)得到的经麦克风阵列初步去噪的语音信号的目标声源方向进行处理,进一步去除噪声残留及语音畸变,提高语音的可懂度,得到最终去噪后的语音信号;5)对步骤4)得到的最终去噪后的语音信号,提取梅尔频率倒谱系数及其一阶、二阶导数共39维,作为特征参数,并输入到通过卷积神经网络模型训练的语音识别系统中进行识别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910581762.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top