[发明专利]一种语音采集方法及系统在审
申请号: | 201811572081.7 | 申请日: | 2018-12-21 |
公开(公告)号: | CN111354369A | 公开(公告)日: | 2020-06-30 |
发明(设计)人: | 杨波;洪泽 | 申请(专利权)人: | 珠海格力电器股份有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G01S5/20 |
代理公司: | 深圳市康弘知识产权代理有限公司 44247 | 代理人: | 尹彦;胡朝阳 |
地址: | 519000*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 采集 方法 系统 | ||
本发明公开了一种语音采集方法和系统,所述方法包括步骤S1:确定目标声源的当前位置;步骤S2:控制麦克风阵列对以目标声源的当前位置为中心、设定的目标声源的最大移动距离为半径的目标区域进行下一时刻语音数据的采集。本发明的语音采集方法和系统可降低声源跟踪的计算量。
技术领域
本发明涉及语音识别领域,尤其涉及一种语音采集方法及系统。
背景技术
随着物联网与人工智能的发展,语音识别、语音控制等智能交互领域都要求能获得高质量的语音,而实际的室内场景会存在各种噪声或多个声源,这就对语音的采集提出了较高的要求,因为只有采集到高质量的语音才能提高人工智能机器对语音的识别率,人们也能较好对机器进行语音控制,从而带来良好的人机交互。
获得更好的语音质量其实转化为三个步骤:如何区分声源;如何语音定向;如何进行语音跟踪。对于普通的室内环境,语音信号可以看作是一个近场宽带信号,信号源可以看作一个点源,它向360度的球体空间传播声音,传统方法是对多声源进行空域变换和滤波,获得具有特定特征的单一的感兴趣的声源,再采用波束定向控制,对感兴趣的声音进行采集。这种方式存在以下两方面问题:一方面计算量大,它需要实时同时采集多声源信息,然后再进行定向采集,因为声源在室内环境下通常是移动的而非静止不动的;另一方面如何采用智能化方法从多声源中提取出感兴趣的声音。
发明内容
本发明的目的是针对上述现有技术存在的缺陷,提供一种语音采集方法及系统,以解决现有技术中的声源跟踪计算量大的技术问题。
本发明实施例中,提供了一种语音采集方法,其包括
步骤S1:确定目标声源的当前位置;
步骤S2:控制麦克风阵列对以目标声源的当前位置为中心、设定的目标声源的最大移动距离为半径的目标区域进行下一时刻语音数据的采集。
本发明实施例中,所述的语音采集方法还包括
步骤S3:判断目标声源是否在所述目标区域,如果目标声源在所述目标区域,则进入步骤S4,否则返回步骤S1;
步骤S4:获取目标声源的位置并且更新当前时刻中目标声源的位置信息,并返回步骤S2。
本发明实施例中,步骤S1具体包括
对麦克风阵列采集到的当前时刻的语音数据中的多个声源进行定位,从而获得各个声源的位置;
通过声纹识别从所述多个声源中找出目标声源。
本发明实施例中,步骤S1中,采用可控波束定位法来对多个声源进行定位。
本发明实施例中,步骤S1中,采用人工智能声纹识别算法找出目标声源的位置。
本发明实施例中,步骤S2中,还包括:
根据目标声源移动速度与语音时刻间隔时间来预估下一时刻中目标声源的位置。
本发明实施例中,还提供了一种语音采集系统,其包括
麦克风阵列,用于采集环境中的语音数据;
声源定位模块,用于在所述麦克风阵列采集到的语音数据中确定目标声源的当前位置;
控制模块,用于控制所述麦克风阵列对以目标声源的当前位置为中心、设定的目标声源的最大移动距离为半径的目标区域进行下一时刻语音数据的采集。
本发明实施例中,所述的语音采集系统还包括:
判断模块,用于判断目标声源是否在所述目标区域,如果目标声源在所述目标区域,则所述声源定位模块获取目标声源的位置并且更新当前时刻中目标声源的位置信息,否则所述控制模块控制麦克风阵列重新采集的语音数据并进行目标声源定位。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海格力电器股份有限公司,未经珠海格力电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811572081.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种终端数据库数据迁移方法及系统
- 下一篇:一种埋入式元件电路板及其制作方法