[发明专利]连续唤醒识别功能的优化方法和装置有效
申请号: | 201911379635.6 | 申请日: | 2019-12-27 |
公开(公告)号: | CN111128166B | 公开(公告)日: | 2022-11-25 |
发明(设计)人: | 李路天;甘津瑞 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/30;G10L25/78;H04L67/5683 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;邓婷婷 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 连续 唤醒 识别 功能 优化 方法 装置 | ||
本发明公开连续唤醒识别功能的优化方法和装置,其中,方法包括:持续接收音频直至检测到唤醒词;对包含唤醒词的音频进行语音识别以形成第一语音识别结果,并在预设时间内缓存第一音频之后接收的第二音频;判断第一语音识别结果中是否包含除唤醒词外的语音;若第一语音识别结果中不包含除唤醒词外的语音,判断对于所述第二音频的语音活性检测是否超时;若语音活性检测未超时,对第二音频进行语音识别以形成第二语音识别结果;若第二语音识别结果中包含除唤醒词外的语音,回调第二语音识别结果。本申请的方法和装置提供的方案可以对现有的连续唤醒识别功能进行优化,用户体验更好。
技术领域
本发明属于语音唤醒识别技术领域,尤其涉及连续唤醒识别功能的优化方法和装置。
背景技术
相关技术中,OneShot即一语即达,通俗点可以称之为“一把说”,采用“唤醒词+语音语义识别”一体化方式,实现唤醒词与语音操控之间零间隔、零延迟、无缝对接,摒弃传统的一问一答的形式,极大减少用户语音操控的步骤,实现信息反馈,化繁为简,实现简便操作,但这样的简便在设计之初却并不简单。
OneShot的一大特点是识别唤醒与语义理解一体化,保证语音交互的统一性与连贯性,完成操控。也就是说,用户可以直接下达指令,而不需要像过去的语音交互方式必须要一问一答才能开始交互。OneShot功能可以一语即中,实现“唤醒词+语音语义识别”一体化,相比较传统的语音交互在效率上要高得多。
现有技术中类似OneShot的技术有某飞的“唤醒识别”和某度的“唤醒识别连续说”。
发明人在实现本申请的过程中发现上述技术都没有公开对OneShot不足情况下的解决方案。并且虽然上述方案可在相对理想的语音环境下实现Oneshot功能,但是当音频出现以下情况时往往只能识别到唤醒词而把命令词丢弃了:
1)AEC(回声消除)消除不干净;
2)环境噪音大;
3)用户说得比较慢时使得唤醒词和命令词之间无声时间过长。
发明内容
本发明实施例提供一种连续唤醒识别功能的优化方法和装置,用于至少解决上述技术问题之一。
第一方面,本发明实施例提供一种连续唤醒识别功能的优化方法,包括:持续接收音频直至检测到唤醒词;对包含唤醒词的音频进行语音识别以形成第一语音识别结果,并在预设时间内继续缓存所述第一音频之后接收的第二音频;判断所述第一语音识别结果中是否包含除唤醒词外的语音;若所述第一语音识别结果中不包含除唤醒词外的语音,判断对于所述第二音频的语音活性检测是否超时;若所述语音活性检测未超时,对所述第二音频进行语音识别以形成第二语音识别结果;以及若所述第二语音识别结果中包含除唤醒词外的语音,回调所述第二语音识别结果。
第二方面,本发明实施例提供一种连续唤醒识别功能的优化装置,包括:唤醒检测模块,配置为持续接收音频直至检测到唤醒词;第一识别模块,配置为对包含唤醒词的音频进行语音识别以形成第一语音识别结果,并在预设时间内继续缓存第一音频之后接收的第二音频;识别判断模块,配置为判断所述第一语音识别结果中是否包含除唤醒词外的语音;超时判断模块,配置为若所述第一语音识别结果中不包含除唤醒词外的语音,判断对于所述第二音频的语音活性检测是否超时;第二识别模块,配置为若所述语音活性检测未超时,对所述第二音频进行语音识别以形成第二语音识别结果;以及回调模块,配置为若所述第二语音识别结果中包含除唤醒词外的语音,回调所述第二语音识别结果。
第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例的连续唤醒识别功能的优化方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911379635.6/2.html,转载请声明来源钻瓜专利网。