[发明专利]一种语音处理方法及设备在审
申请号: | 201810603522.9 | 申请日: | 2018-06-06 |
公开(公告)号: | CN110634498A | 公开(公告)日: | 2019-12-31 |
发明(设计)人: | 田彪;余涛 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L15/22;G10L15/25;G10L15/30 |
代理公司: | 11127 北京三友知识产权代理有限公司 | 代理人: | 李辉 |
地址: | 英属开曼*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 麦克风阵列 前端处理 环境信号 环境信息 语音信号 录制 语音 处理效率 环境因素 语义理解 语音处理 语音识别 申请 融合 | ||
本申请实施方式公开了一种语音处理方法及设备。所述方法包括:获取用于录制语音信号的麦克风阵列的至少一个环境信号;对所述环境信号进行处理,确定所述麦克风阵列的环境信息;根据所述环境信息对录制的语音信号进行语音前端处理。利用本申请的技术方案,可以将麦克风阵列周围的环境因素融合至语音前端处理技术中,这样,不仅可以提高前端处理过程的处理效率以及处理准确性,还可以提高后续语音识别及语义理解的准确性。
技术领域
本申请涉及计算机技术领域,特别涉及一种语音处理方法及设备。
背景技术
近年来,语音识别技术取得显著进步,已经逐渐从实验室走向市场。典型地,语音识别技术已经在工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等多个领域中广泛应用。语音识别技术所涉及的技术领域比较复杂,其中包括信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。
语音识别过程中包括前端处理的环节,前端处理是指在对语音信号特征提取之前,先对原始语音信号进行处理,部分消除噪声或者不同说话人带来的影响,使处理后的语音信号更能反映语音的本质特征。现有技术中最常用的前端处理技术包括端点检测和语音增强。端点检测是指在语音信号中将语音和非语音信号时段区分开来,准确地确定出语音信号的起点和终点。经过端点检测后,后续处理就可以只对语音信号进行,这对提高语音识别模型的精确度和正确率具有重要作用。语音增强的主要任务就是消除环境噪声对语音信号的影响,目前通用的方法是采用维纳滤波、卡尔曼滤波等方式对语音信号进行滤波处理。
由上述可知,现有技术中的前段处理技术仅仅针对纯语音信号进行处理,对于提取出语音信号的本质特征具有较大的局限性。因此,现有技术中亟需一种能够从多个层面对语音信号进行前端处理的技术。
发明内容
本申请实施方式的目的是提供一种语音处理方法及设备,可以将麦克风阵列周围的环境因素融合至语音前端处理技术中,这样,不仅可以提高前端处理过程的处理效率以及处理准确性,还可以提高后续语音识别即语义理解的准确性。
具体地,所述语音处理方法及设备是这样实现的:
一种语音处理方法,所述方法包括:
获取用于录制语音信号的麦克风阵列的至少一个环境信号;
对所述环境信号进行处理,确定所述麦克风阵列的环境信息;
根据所述环境信息对录制的语音信号进行语音前端处理。
一种语音处理装置,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现上述实施例所述方法的步骤。
一种语音处理设备,包括:麦克风阵列、至少一种传感设备、处理器,其中:
所述麦克风阵列,用于录制语音信号;
所述至少一种传感设备,部署于所述麦克风阵列的录制范围内,用于获取所述麦克风阵列录制范围内的环境信号;
所述处理器,用于对所述环境信号进行处理,确定所述麦克风阵列的环境信息,并根据所述环境信息对录制的语音信号进行语音前端处理。
一种业务服务设备,包括语音处理模块,所述语音处理模块与所述业务服务设备的主机相耦合,所述语音处理模块用于:
获取用于录制语音信号的麦克风阵列的至少一个环境信号;
对所述环境信号进行处理,确定所述麦克风阵列的环境信息;
根据所述环境信息对录制的语音信号进行语音前端处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810603522.9/2.html,转载请声明来源钻瓜专利网。