[发明专利]信号生成的方法、基于人工智能的语音识别方法及装置有效
申请号: | 201910843381.2 | 申请日: | 2019-09-06 |
公开(公告)号: | CN110517702B | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 郑脊萌;刘二男;黎韦伟;陈联武 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0216;G10L25/51 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 吴磊 |
地址: | 518064 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信号 生成 方法 基于 人工智能 语音 识别 装置 | ||
1.一种信号生成的方法,其特征在于,包括:
当通过麦克风阵列获取目标语音帧对应的语音输入信号时,根据所述语音输入信号获取待估计角度对应的第一信号能量,其中,所述麦克风阵列包括多个麦克风,所述待估计角度在入射方位角范围内;
根据所述目标语音帧所对应的语音输入信号以及波束形成器系数,确定所述目标语音帧对应的第二信号能量;
根据所述第一信号能量以及所述第二信号能量,确定所述待估计角度对应的空间特征;
根据所述空间特征生成所述目标语音帧对应的目标控制信号,其中,所述目标控制信号用于估计语音的方向。
2.根据权利要求1所述的方法,其特征在于,所述根据所述语音输入信号获取待估计角度对应的第一信号能量,包括:
根据所述语音输入信号以及第一波束形成器系数,获取所述估计角度对应的第一信号能量,其中,所述第一波束形成器系数为第一固定波束形成器所对应的系数;
所述根据所述目标语音帧所对应的语音输入信号以及波束形成器系数,确定所述目标语音帧对应的第二信号能量,包括:
根据所述目标语音帧所对应的所述语音输入信号,确定所述目标语音帧所对应的信号快拍;
根据所述目标语音帧所对应的信号快拍以及所述第一波束形成器系数,确定入射方位角的信号能量,其中,所述入射方位角在所述入射方位角范围内;
根据所述入射方位角范围中各个入射方位角的信号能量,计算得到所述目标语音帧对应的所述第二信号能量。
3.根据权利要求2所述的方法,其特征在于,所述空间特征为空间能量占比;
所述根据所述第一信号能量以及所述第二信号能量,确定所述待估计角度对应的空间特征,包括:
采用如下方式计算所述待估计角度对应的空间特征:
其中,所述r(n,θ)表示所述待估计角度对应的空间能量占比,所述θ表示所述待估计角度,所述n表示所述目标语音帧,所述p(n,θ)表示所述待估计角度所对应的所述第一信号能量,所述表示入射方位角,所述表示所述入射方位角范围中的入射方位角最小值,所述表示所述入射方位角范围中的入射方位角最大值,所述表示所述入射方位角所对应的信号能量,所述表示所述目标语音帧对应的所述第二信号能量,所述f表示频点,所述f0表示用于估计信号能量的频率范围所对应的频点最小值,所述f1表示用于估计信号能量的频率范围所对应的频点最大值,所述表示在所述频点f上指向所述入射方位角的所述第一波束形成器系数,所述(·)H表示共轭转置,所述S(n,f)表示所述目标语音帧所对应的所述信号快拍,所述Si(n,f)表示所述麦克风阵列中第i个麦克风在所述目标语音帧的短时傅立叶变换在所述频点f处的结果,所述N表示所述麦克风阵列中的麦克风总数量。
4.根据权利要求1所述的方法,其特征在于,所述根据所述语音输入信号获取待估计角度对应的第一信号能量,包括:
根据所述语音输入信号以及第一波束形成器系数,获取所述估计角度在频点上的第一信号能量,其中,所述第一波束形成器系数为第一固定波束形成器所对应的系数;
所述根据所述目标语音帧所对应的语音输入信号以及波束形成器系数,确定所述目标语音帧对应的第二信号能量,包括:
根据所述目标语音帧所对应的所述语音输入信号,确定所述目标语音帧所对应的信号快拍;
根据所述目标语音帧所对应的信号快拍以及所述第一波束形成器系数,确定入射方位角在频点上的信号能量,其中,所述入射方位角在所述入射方位角范围内;
根据所述入射方位角范围中各个入射方位角在所述频点上的信号能量,计算得到所述目标语音帧在所述频点上对应的所述第二信号能量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910843381.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种麦克风阵列语音增强方法及实现装置
- 下一篇:一种声音采集方法、装置及介质