[发明专利]一种车内多音区拾音方法、装置、电子设备及存储介质在审
申请号: | 202010268061.1 | 申请日: | 2020-04-07 |
公开(公告)号: | CN111599357A | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 迟翔 | 申请(专利权)人: | 宁波吉利汽车研究开发有限公司;浙江吉利控股集团有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/20;G10L21/0208;G10L21/0216 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;贾允 |
地址: | 315336 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 多音 区拾音 方法 装置 电子设备 存储 介质 | ||
本申请实施例所公开的一种车内多音区拾音方法、装置、电子设备及存储介质,其中,方法包括获取车内多音区设置的麦克风所接收的语音信号集合,从中确定语音控制信号集合以及每个语音控制信号对应的时间,并根据每个语音控制信号对应的时间确定出目标语音控制信号以及对应的目标音区,并对目标音区进行过滤降噪操作,使得目标语音控制信号的强度高于非目标语音控制信号的强度,且使得目标语音控制信号的强度大于识别强度阈值,控制目标语音控制信号中相应的执行主体执行相应的动作。通过结合Beamforming技术和PIC技术,能够实现在车内多音区的环境下对目标语音控制信号和目标音区的唤醒拾音声源定位,并且还能够提高拾音降噪的效果。
技术领域
本发明涉及自动语音识别技术领域,尤其涉及一种车内多音区拾音方法、装置、电子设备及存储介质。
背景技术
近年来,随着人工智能的快速发展,语音识别技术和回声消除技术逐步应用于车载互联网系统。然而由于车内环境相对复杂,风切声、引擎声、冷气风扇声和乘坐人员的说话声等噪声将直接干扰语音识别,降低语音识别率,导致语音识别出错或者无响应。
如何在车内实现良好的降噪和声源定位以提高语音识别率是当前车辆制造业的研究热点。目前市场上的主流方案是基于麦克风阵列的波束成形方法,该方法通过将麦克风阵列采集到的声音信号进行加权相加,使得在目标方向形成拾音波束,同时衰减除目标方向外其他方向的声音信号,进而实现对特定方向上的声音信号的拾取,达到降噪的目的。此外,麦克风阵列还可以进行声源定位,通过使用麦克风阵列计算目标说话人与麦克风间的角度和距离,进而实现对目标说话人的跟踪以及对后续的语音定向拾取。
当唤醒后,由于纵深问题,车内后排乘客的声音将影响主驾驶人员的拾音,如图1所示,因此,基于麦克风阵列的波束成形方法难以兼顾车内前后排多音区的声源定位,在多音区的应用中具有局限性。
发明内容
本申请实施例提供一种车内多音区拾音方法,该多音区中每个音区设置有麦克风,麦克风用于接收语音信号,
上述方法包括:
获取车内多音区的语音信号集合;语音信号集合是车内多音区中每个音区设置的麦克风接收的;
从语音信号集合中确定语音控制信号集合;语音控制信号集合中的语音控制信号携带有唤醒标识;
确定语音控制信号集合中每个语音控制信号对应的时间;
根据每个语音控制信号对应的时间从语音控制信号集合中确定目标语音控制信号;语音控制信号集合包括目标语音控制信号和非目标语音控制信号,目标语音控制信号对应的时间比非目标语音控制信号对应的时间早;
确定目标语音控制信号对应的目标音区;目标音区在多音区内;
对目标音区进行过滤降噪操作,使得目标语音控制信号的强度高于非目标语音控制信号的强度,且使得目标语音控制信号的强度大于识别强度阈值;
控制目标语音控制信号中相应的执行主体执行相应的动作。
进一步地,获取车内多音区的语音信号集合之前,上述方法还包括:
确定主驾拾音开关的状态;
若主驾拾音开关处于工作状态,接收主驾对应的音区中麦克风接收的主驾语音控制信号;主驾对应的音区在车内多音区内;
控制主驾语音控制信号中相应的执行主体执行相应的动作。
进一步地,对目标音区进行过滤降噪操作,包括:
对目标语音控制信号进行音频信号增强操作,
以及利用回音消除算法对非目标语音控制信号进行音频信号抑制操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波吉利汽车研究开发有限公司;浙江吉利控股集团有限公司,未经宁波吉利汽车研究开发有限公司;浙江吉利控股集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010268061.1/2.html,转载请声明来源钻瓜专利网。