[发明专利]语音处理方法、装置、计算机设备及存储介质在审

申请号：	201910390372.2	申请日：	2019-05-10
公开（公告）号：	CN110232916A	公开（公告）日：	2019-09-13
发明（设计）人：	王健宗;贾雪丽	申请（专利权）人：	平安科技（深圳）有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/28
代理公司：	深圳众鼎专利商标代理事务所(普通合伙) 44325	代理人：	黄章辉
地址：	518000 广东省深圳市福田区福***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	实时环境语音处理逻辑指令计算机设备存储介质语音识别口语缓存音频缓冲器设备执行用户体验语音指令指令转化检测唤醒指令
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及语音处理领域，公开了一种语音处理方法、装置、计算机设备及存储介质。其方法包括：通过音频缓冲器缓存实时环境声音信号；检测所述实时环境声音信号是否包含指定关键词；若检测到所述实时环境声音信号包含所述指定关键词，则通过语音识别模型对所述实时环境声音信号进行识别，获得用户口语指令；将所述用户口语指令转化为机器逻辑指令；将所述机器逻辑指令发送到执行设备，以使执行设备执行所述机器逻辑指令。本发明提供的语音处理方法，可以克服现有技术中唤醒和语音识别不同步，实时对用户的语音指令进行识别，提高了用户体验。

技术领域

本发明涉及语音处理领域，尤其涉及一种语音处理方法、装置、计算机设备及存储介质。

背景技术

现有的一部分语音识别系统，是依赖于语音进行激活的。这种语音交互系统，往往依赖于对用户语音中的关键词进行识别。例如，一具有语音交互功能的智能音箱，其设置的唤醒关键词为“Hello”，当用户在智能音箱附近说出“Hello”，智能音箱的语音识别模块在关键词监测模式下监测到该“Hello”语音，然后将语音识别模块切换工作模式(从关键词监测模式切换为语音识别模式)，监听用户发出的语音指令(语音指令可以用于命令智能音箱打开音乐或播报新闻等)。

然而，在现有的语音识别过程中，关键词识别与语音指令识别之间存在一定的时间间隔(切换工作模式需要一定时间)，导致用户在连续说出唤醒关键词与语音指令时，语音指令无法被正确识别(因为此时语音识别模式尚未启用)。虽然，在时间间隔内，可以通过播放一个简短的铃声或者产生一些视觉反馈来通知用户设备已经完成加载，可以使用语音指令进行下一步操作。然而，这种时间间隔产生的停顿在语音的自然流中产生中断，对用户体验的质量产生负面影响。

发明内容

基于此，有必要针对上述技术问题，提供一种语音处理方法、装置、计算机设备及存储介质，以克服现有技术中，唤醒和语音识别不同步，导致用户体验不佳的问题。

一种语音处理方法，包括：

通过音频缓冲器缓存实时环境声音信号；

检测所述实时环境声音信号是否包含指定关键词；

若检测到所述实时环境声音信号包含所述指定关键词，则通过语音识别模型对所述实时环境声音信号进行识别，获得用户口语指令；

将所述用户口语指令转化为机器逻辑指令；

将所述机器逻辑指令发送到执行设备，以使执行设备执行所述机器逻辑指令。

一种语音处理装置，包括：

缓存模块，用于通过音频缓冲器缓存实时环境声音信号；

检测模块，用于检测所述实时环境声音信号是否包含指定关键词；

识别模块，用于若检测到所述实时环境声音信号包含所述指定关键词，则通过语音识别模型对所述实时环境声音信号进行识别，获得用户口语指令；