[发明专利]语音唤醒方法、电子设备和存储介质在审
申请号: | 202111570928.X | 申请日: | 2021-12-21 |
公开(公告)号: | CN114155857A | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 邓建凯;陈家欢;甘津瑞;俞凯 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/30;G10L25/78 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;邓婷婷 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 唤醒 方法 电子设备 存储 介质 | ||
1.一种语音唤醒方法,包括:
持续缓存用户音频流,判断所述用户音频流是否能够触发唤醒;
响应于所述用户音频流触发唤醒,将自触发唤醒的时间点回退第一预设时间间隔后得到的回退音频流发送给语音活性检测模块进行语音活性检测,其中,所述语音活性检测模块在检测到第二预设时间间隔的非人声后结束检测;
在所述语音活性检测模块检测的同时实时将所述回退音频流发送至服务器端进行识别得到第一识别结果;
判断所述第一识别结果中是否包含除唤醒词之外的其他人声;
若所述第一识别结果中包含除唤醒词之外的其他人声,进入oneshot模式,其中,所述oneshot模式为响应唤醒词和命令词一起连说的模式。
2.根据权利要求1所述的方法,其中,在所述判断所述第一识别结果中是否包含除唤醒词之外的其他人声之后,所述方法还包括:
若所述第一识别结果中不包含除唤醒词之外的其他人声,进入非oneshot模式。
3.根据权利要求1所述的方法,其中,所述服务器端返回的所述第一识别结果中不包含唤醒词,所述判断所述第一识别结果中是否包含除唤醒词之外的其他人声包括:
判断所述第一识别结果是否为空。
4.根据权利要求3所述的方法,其中,所述若所述第一识别结果中包含除唤醒词之外的其他人声,进入oneshot模式包括:
若所述第一识别结果不为空,进入oneshot模式。
5.根据权利要求3所述的方法,其中,在所述判断所述第一识别结果是否为空之后,所述方法还包括:
若所述第一识别结果为空,进入非oneshot模式。
6.根据权利要求1-3中任一项所述的方法,其中,在所述若所述第一识别结果中包含除唤醒词之外的其他人声,进入oneshot模式之后,所述方法还包括:
获取当前的oneshot交互模式,其中,所述oneshot交互模式包括继续监听和播报欢迎语。
7.根据权利要求6所述的方法,其中,在所述获取当前的oneshot交互模式之后,所述方法还包括:
若所述oneshot交互模式为继续监听,则将所述用户音频流中未进行语音活性检测的后续音频流继续发送至所述语音活性检测模块进行检测,并同时将所述后续音频流发送至所述服务器进行识别得到第二识别结果;
基于所述第二识别结果对所述用户音频流进行响应。
8.根据权利要求6所述的方法,其中,在所述获取当前的oneshot交互模式之后,所述方法还包括:
若所述oneshot交互模式为播放欢迎语,则播放欢迎语。
9.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1至8任一项所述方法的步骤。
10.一种存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现权利要求1至8任一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111570928.X/1.html,转载请声明来源钻瓜专利网。