[发明专利]一种适用于噪声环境下的语音识别方法在审

申请号：	201910581762.8	申请日：	2019-06-30
公开（公告）号：	CN110148420A	公开（公告）日：	2019-08-20
发明（设计）人：	曾庆宁;卜玉婷;刘伟波	申请（专利权）人：	桂林电子科技大学
主分类号：	G10L21/0208	分类号：	G10L21/0208;G10L15/22;G10L25/30;G10L25/24
代理公司：	桂林市华杰专利商标事务所有限责任公司 45112	代理人：	杨雪梅
地址：	541004 广***	国省代码：	广西;45
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种适用于噪声环境下的语音识别方法，该方法对经双微麦克风阵列采集的含噪语音信号构建综合了最小方差无畸变响应波束形成与对角加载的波束形成器，并利用递归矩阵求逆的方法减少计算复杂度，得到进行波束形成后初步去噪的语音信号；再后置调制域谱减法对初步去噪后的语音信号做进一步处理，去除残留的噪声并减少语音畸变，得到最终去噪处理后的语音信号；另外本发明方法采用卷积神经网络进行语音模型的训练，提取语音深层次的特征。该发明方法解决了噪声环境下语音识别率下降的问题，具有较好的稳健性，可应用在家居机器人，智能音箱以及噪声环境下工作的语音设备等方面。
搜索关键词：	语音信号噪声环境语音识别去噪波束形成畸变语音卷积神经网络波束形成器计算复杂度对角矩阵求逆微麦克风语音模型语音设备智能音箱最小方差调制域稳健性递归构建后置加载减法去除噪声机器人采集残留响应应用
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种适用于噪声环境下的语音识别方法，其特征在于，包括如下步骤：1)采集双微麦克风阵列语音信号，并对采集的语音信号建立如下形式模型：y_m(t)＝x_m(t)+n_m(t) m＝ 1,2,...,M (1)上述公式(1)中，M表示麦克风数量，x_m(t)表示纯净语音信号，n_m(t)表示加性的噪声和干扰信号，y_m(t)表示含噪语音信号；2)对步骤1)采集到的含噪语音信号进行傅里叶变换，得到频域，频域表达式为：Y(l,k)＝X(l,k)+N(l,k) (2)上述公式(2)中，X(l,k)表示原始纯净语音信号频谱，N(l,k)表示噪声信号频谱，Y(l,k)表示含噪语音信号，l是时间索引，k是频率索引；3)构建综合最小方差无畸变响应波束形成与对角加载的双微阵列语音波束形成器，并利用递归矩阵求逆的方法减少了原先大量矩阵求逆运算导致的计算复杂度，求得波束形成器的复数加权系数，将步骤2)中的麦克风阵列信号的矢量系数与波束形成器求得的复数加权系数相乘，得到麦克风阵列初步去噪的语音信号；4)在构建的双微阵列语音波束形成器之后，后置调制域谱减法，对步骤3)得到的经麦克风阵列初步去噪的语音信号的目标声源方向进行处理，进一步去除噪声残留及语音畸变，提高语音的可懂度，得到最终去噪后的语音信号；5)对步骤4)得到的最终去噪后的语音信号，提取梅尔频率倒谱系数及其一阶、二阶导数共39维，作为特征参数，并输入到通过卷积神经网络模型训练的语音识别系统中进行识别。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学，未经桂林电子科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910581762.8/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种适用于噪声环境下的语音识别方法在审

专利文献下载