[发明专利]信号生成的方法、基于人工智能的语音识别方法及装置有效
申请号: | 201910843381.2 | 申请日: | 2019-09-06 |
公开(公告)号: | CN110517702B | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 郑脊萌;刘二男;黎韦伟;陈联武 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0216;G10L25/51 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 吴磊 |
地址: | 518064 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信号 生成 方法 基于 人工智能 语音 识别 装置 | ||
本申请公开了一信号生成的方法,该方法应用于人工智能领域,包括:当通过麦克风阵列获取目标语音帧对应的语音输入信号时,根据语音输入信号获取待估计角度对应的第一信号能量,待估计角度在入射方位角范围内;根据目标语音帧所对应的语音输入信号以及波束形成器系数,确定目标语音帧对应的第二信号能量;根据第一信号能量以及第二信号能量,确定待估计角度对应的空间特征;根据空间特征生成目标语音帧对应的目标控制信号。本申请还公开了一种基于人工智能的语音识别方法及装置。本申请能够分别确定来自各个待估计角度方向上的空间特征,基于空间特征生成相应的控制信号,提升控制信号的准确性和鲁棒性,提高前处理系统对语音信号增强的性能。
技术领域
本申请涉及人工智能领域,尤其涉及信号生成的方法、基于人工智能的语音识别方法及装置。
背景技术
随着智能音箱等智能设备的流行,人机之间的语音交互频率越来越高,而远场语音交互作为一个重要的人机交互场景,受到了较大的关注。相对与近场语音来说,远场语音主要的技术难点在于对于多径反射、混响效应及背景噪音干扰的处理。
为了实现更好的远场语音交互性能,智能设备往往都装备有多麦克风阵列和前端语音处理系统。前端语音处理系统基于目标人声和干扰噪声来源方向不同的假设,往往会采用自适应波束形成算法来抑制干扰噪声,并增强目标人声。而自适应波束形成算法的性能又极其依赖外界向其提供的控制信号。目前,控制信号是通过单声道的话音激活检测(Voice Activity Detector,VAD)产生,即通过信号能量强弱或与人声模型的匹配程度区分输入信号为人声或非人声,如果判断为人声则默认为是目标人声。
然而,在智能家居的应用场景中往往会出现“鸡尾酒会”情形,即有多个人声或类人声噪声(例如电视噪声)同时出现,在这样的场景下,导致单声道VAD产生的控制信号准确度较低,而控制信号的准确性将极大影响前处理系统的整体性能,进而影响远场唤醒和识别性能。
发明内容
本申请实施例提供了一种信号生成的方法、基于人工智能的语音识别方法及装置,能够根据麦克风阵列获取到的语音输入信号,分别确定来自各个待估计角度方向上的空间特征,基于空间特征生成相应的控制信号,可以提升控制信号的准确性和鲁棒性,从而提高前处理系统对语音信号增强的性能。
有鉴于此,本申请第一方面提供一种信号生成的方法,包括:
当通过麦克风阵列获取目标语音帧对应的语音输入信号时,根据所述语音输入信号获取待估计角度对应的第一信号能量,其中,所述麦克风阵列包括多个麦克风,所述待估计角度在入射方位角范围内;
根据所述目标语音帧所对应的语音输入信号以及波束形成器系数,确定所述目标语音帧对应的第二信号能量;
根据所述第一信号能量以及所述第二信号能量,确定所述待估计角度对应的空间特征;
根据所述空间特征生成所述目标语音帧对应的目标控制信号,其中,所述目标控制信号用于估计语音的方向。
本申请第二方面提供一种基于人工智能的语音识别方法,包括:
当通过麦克风阵列获取目标语音帧对应的语音输入信号时,根据所述语音输入信号获取待估计角度对应的第一信号能量,其中,所述麦克风阵列包括多个麦克风,所述待估计角度在入射方位角范围内;
根据所述目标语音帧所对应的语音输入信号以及波束形成器系数,确定所述目标语音帧对应的第二信号能量;
根据所述第一信号能量以及所述第二信号能量,确定所述待估计角度对应的空间特征;
根据所述空间特征生成所述目标语音帧对应的目标控制信号;
若所述目标控制信号为目标人声所对应的信号,则根据所述语音输入信号获取唤醒结果以及信号到达方向;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910843381.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种麦克风阵列语音增强方法及实现装置
- 下一篇:一种声音采集方法、装置及介质