[发明专利]一种语音处理方法及设备在审

申请号：	201810603522.9	申请日：	2018-06-06
公开（公告）号：	CN110634498A	公开（公告）日：	2019-12-31
发明（设计）人：	田彪;余涛	申请（专利权）人：	阿里巴巴集团控股有限公司
主分类号：	G10L21/0216	分类号：	G10L21/0216;G10L15/22;G10L15/25;G10L15/30
代理公司：	11127 北京三友知识产权代理有限公司	代理人：	李辉
地址：	英属开曼***	国省代码：	开曼群岛;KY
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	麦克风阵列前端处理环境信号环境信息语音信号录制语音处理效率环境因素语义理解语音处理语音识别申请融合
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请实施方式公开了一种语音处理方法及设备。所述方法包括：获取用于录制语音信号的麦克风阵列的至少一个环境信号；对所述环境信号进行处理，确定所述麦克风阵列的环境信息；根据所述环境信息对录制的语音信号进行语音前端处理。利用本申请的技术方案，可以将麦克风阵列周围的环境因素融合至语音前端处理技术中，这样，不仅可以提高前端处理过程的处理效率以及处理准确性，还可以提高后续语音识别及语义理解的准确性。

技术领域

本申请涉及计算机技术领域，特别涉及一种语音处理方法及设备。

背景技术

近年来，语音识别技术取得显著进步，已经逐渐从实验室走向市场。典型地，语音识别技术已经在工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等多个领域中广泛应用。语音识别技术所涉及的技术领域比较复杂，其中包括信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。

语音识别过程中包括前端处理的环节，前端处理是指在对语音信号特征提取之前，先对原始语音信号进行处理，部分消除噪声或者不同说话人带来的影响，使处理后的语音信号更能反映语音的本质特征。现有技术中最常用的前端处理技术包括端点检测和语音增强。端点检测是指在语音信号中将语音和非语音信号时段区分开来，准确地确定出语音信号的起点和终点。经过端点检测后，后续处理就可以只对语音信号进行，这对提高语音识别模型的精确度和正确率具有重要作用。语音增强的主要任务就是消除环境噪声对语音信号的影响，目前通用的方法是采用维纳滤波、卡尔曼滤波等方式对语音信号进行滤波处理。

由上述可知，现有技术中的前段处理技术仅仅针对纯语音信号进行处理，对于提取出语音信号的本质特征具有较大的局限性。因此，现有技术中亟需一种能够从多个层面对语音信号进行前端处理的技术。

发明内容

本申请实施方式的目的是提供一种语音处理方法及设备，可以将麦克风阵列周围的环境因素融合至语音前端处理技术中，这样，不仅可以提高前端处理过程的处理效率以及处理准确性，还可以提高后续语音识别即语义理解的准确性。

具体地，所述语音处理方法及设备是这样实现的：

一种语音处理方法，所述方法包括：

获取用于录制语音信号的麦克风阵列的至少一个环境信号；

对所述环境信号进行处理，确定所述麦克风阵列的环境信息；

根据所述环境信息对录制的语音信号进行语音前端处理。

一种语音处理装置，包括处理器以及用于存储处理器可执行指令的存储器，所述处理器执行所述指令时实现上述实施例所述方法的步骤。

一种语音处理设备，包括：麦克风阵列、至少一种传感设备、处理器，其中：

所述麦克风阵列，用于录制语音信号；

所述至少一种传感设备，部署于所述麦克风阵列的录制范围内，用于获取所述麦克风阵列录制范围内的环境信号；