[发明专利]多音区语音识别方法、终端设备和存储介质有效
| 申请号: | 201910433338.9 | 申请日: | 2019-05-23 |
| 公开(公告)号: | CN110310633B | 公开(公告)日: | 2022-05-20 |
| 发明(设计)人: | 彭汉迎;欧阳能钧;贺学焱 | 申请(专利权)人: | 阿波罗智联(北京)科技有限公司 |
| 主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/28;G10L15/30 |
| 代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 朱颖;刘芳 |
| 地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 多音 语音 识别 方法 终端设备 存储 介质 | ||
1.一种多音区语音识别方法,其特征在于,应用于终端设备,所述终端设备内设置有唤醒引擎,所述唤醒引擎的数量为1个,所述方法包括:
获取识别区域的N个音区各自的语音信号,N为大于1的整数;
根据所述唤醒引擎和所述N个音区各自的语音信号,获取所述N个音区对应的N个唤醒结果;
根据所述N个音区各自的语音信号对应的唤醒结果,从所述N个音区中确定待识别音区;
对所述待识别音区的语音信号进行语音识别;
所述根据所述唤醒引擎和所述N个音区各自的语音信号,获取所述N个音区对应的N个唤醒结果,包括:
通过所述唤醒引擎加载唤醒词模型,并根据所述唤醒词模型获取所述N个音区各自的语音信号对应的唤醒结果,其中,所述唤醒词模型为用于识别语音信号中的唤醒词的模型;
所述唤醒词模型的数量为N个,所述N个音区和N个唤醒词模型一一对应,所述待识别音区对应的唤醒结果中包括唤醒词和用于指示所述待识别音区的目标标识;或者,
所述唤醒词模型的数量为1个,若第n次获取到的唤醒结果中包括唤醒词,则所述待识别音区为预设排序中排序为第n的音区,所述预设排序为所述N个音区的语音信号被识别的顺序,n=1,…N。
2.根据权利要求1所述的方法,其特征在于,对所述待识别音区的语音信号进行语音识别,包括:
将所述待识别音区的语音信号发送至服务器;
从所述服务器接收所述待识别音区的语音信号的语音识别结果。
3.一种终端设备,包括处理器和存储器,其特征在于,所述终端设备内设置有唤醒引擎,所述唤醒引擎的数量为1个,所述存储器中存储有指令,所述处理器调用所述指令,控制执行如下操作:
获取识别区域的N个音区各自的语音信号,N为大于1的整数;
根据唤醒引擎和所述N个音区各自的语音信号,获取所述N个音区对应的N个唤醒结果;
根据所述N个音区各自的语音信号对应的唤醒结果,从所述N个音区中确定待识别音区;
对所述待识别音区的语音信号进行语音识别;
所述处理器在用于控制执行根据所述唤醒引擎和所述N个音区各自的语音信号,获取所述N个音区对应的N个唤醒结果,具体用于控制执行如下操作:
通过所述唤醒引擎加载唤醒词模型,并根据所述唤醒词模型获取所述N个音区各自的语音信号对应的唤醒结果,其中,所述唤醒词模型为用于识别语音信号中的唤醒词的模型;
所述唤醒词模型的数量为N个,所述N个音区和N个唤醒词模型一一对应,所述待识别音区对应的唤醒结果中包括唤醒词和用于指示所述待识别音区的目标标识;或者,
所述唤醒词模型的数量为1个,若第n次获取到的唤醒结果中包括唤醒词,则所述待识别音区为预设排序中排序为第n的音区,所述预设排序为所述N个音区的语音信号被识别的顺序,n=1,…N。
4.根据权利要求3所述的终端设备,其特征在于,所述处理器在用于控制执行对所述待识别音区的语音信号进行语音识别的操作时,具体用于控制执行如下操作:
将所述待识别音区的语音信号发送至服务器;
从所述服务器接收所述待识别音区的语音信号的语音识别结果。
5.一种计算机可读存储介质,包括程序或指令,其特征在于,当所述程序或指令在计算机上运行时,权利要求1或2所述的方法被执行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿波罗智联(北京)科技有限公司,未经阿波罗智联(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910433338.9/1.html,转载请声明来源钻瓜专利网。





