[发明专利]一种基于麦克风阵列的拾音方法及系统有效
申请号: | 201710061599.3 | 申请日: | 2017-01-26 |
公开(公告)号: | CN106782585B | 公开(公告)日: | 2020-03-20 |
发明(设计)人: | 范利春;朱磊;高鹏 | 申请(专利权)人: | 芋头科技(杭州)有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L15/22 |
代理公司: | 北京中原华和知识产权代理有限责任公司 11019 | 代理人: | 寿宁 |
地址: | 310000 浙江省杭州市余杭区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 麦克风 阵列 方法 系统 | ||
本发明涉及一种基于麦克风阵列的拾音方法及系统,包括:步骤1,使用麦克风阵列拾取并输出多路语音信号中的其中一路进行语音激活检测,判断是否出现语音激活信号,如是,执行步骤2,如否,重复步骤1;步骤2,多路语音信号进行声源定位,获得声源定位方向;步骤3,对声源定位方向的语音信号进行语音增强,获得增强过的语音信号;步骤4,对增强过的语音信号进行语音唤醒检测,判断是否检测到语音唤醒,如是,执行步骤5,否则,重复步骤1;步骤5,麦克风阵列拾取并输出多路语音信号;步骤6,将多路语音信号处理为一路作为最终所拾取到的音输出。本发明能更好地对远场环境下的语音信号进行拾取,尤其在高噪声环境下能够准确的拾音,为远距离的语音控制提供了优秀的解决方案。
技术领域
本发明涉及信号处理领域,尤其涉及一种基于麦克风阵列的拾音方法及系统。
背景技术
录制高质量的语音信号对语音识别等语音分析方法有着至关重要的作用。传统采用单麦克风录音的方式在远距离高噪声环境下录音质量急剧下降,这极大的限制了语音分析方法的应用场景。因此手机上的语音输入法和语音搜索等应用必须保证说话人离手机话筒的距离足够近,这种拾音环境都归为近场拾音。
使用麦克风阵列录音能够利用多通道的语音信号数据进行后期处理,从而抑制噪声,增强目标语音信号。所以在远场拾音中,麦克风阵列成为必不可少的拾音设备。使用麦克风阵列进行拾音的一般步骤为:第一步,确定说话人的位置;第二步,利用波束形成技术对语音信号进行增强。
然而上述方法在实际使用过程中存在以下问题:(1)并不是所有的时刻都有说话人在讲话,同时并非所有时刻的语音都需要进行拾取,这种情况在近场环境中通过按下开始录音键可以轻松解决,但是在远场环境中却不容易进行处理;(2)当有多个说话人的时候很难确定哪一个是需要拾音的说话人。
发明内容
为了解决以上问题,本发明的目的在于提供一种基于麦克风阵列的拾音方法及系统。
一种基于麦克风阵列的拾音方法,其中,包括以下步骤:
步骤1,使用一麦克风阵列拾取并输出的多路语音信号中的其中一路语音信号进行语音激活检测,判断是否出现语音激活信号,如果是,执行步骤2,如果否,重复步骤1;
步骤2,利用所述麦克风阵列输出的多路语音信号进行声源定位,获得声源定位方向;
步骤3,对所述声源定位方向的语音信号进行语音增强,获得增强过的语音信号;
步骤4,对所述增强过的语音信号进行语音唤醒检测,判断是否检测到语音唤醒,如果是,执行步骤5,否则,重复步骤1;
步骤5,所述麦克风阵列拾取并输出多路语音信号;
步骤6,将所述麦克风阵列拾取的多路语音信号处理为一路增强后的语音,作为最终所拾取到的音输出。
本发明的基于麦克风阵列的拾音方法,所述步骤5为:一指向所述声源定位方向的拾音指示灯被点亮,同时所述麦克风阵列拾取并输出多路语音信号。
本发明的基于麦克风阵列的拾音方法,所述步骤1的具体方法如下:
步骤11,自所述麦克风阵列捕获的多路语音信号中选取一路语音信号;
步骤12,检测所述语音信号中说话者的语音起始点及语音结束点;
步骤13,依据所述语音起始点至所述语音结束点之间的信号判断是否出现语音激活信号,如果是,执行步骤2,否则,重复步骤1。
本发明的基于麦克风阵列的拾音方法,所述步骤2中声源定位的具体步骤为:
依据所述麦克风阵列中的至少两个麦克风接收到的信号时间差获取发声声源所在的位置作为声源定位方向。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于芋头科技(杭州)有限公司,未经芋头科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710061599.3/2.html,转载请声明来源钻瓜专利网。