[发明专利]语音处理方法、装置、计算机设备及存储介质在审
申请号: | 201910390372.2 | 申请日: | 2019-05-10 |
公开(公告)号: | CN110232916A | 公开(公告)日: | 2019-09-13 |
发明(设计)人: | 王健宗;贾雪丽 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/28 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 黄章辉 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实时环境 语音处理 逻辑指令 计算机设备 存储介质 语音识别 口语 缓存 音频缓冲器 设备执行 用户体验 语音指令 指令转化 检测 唤醒 指令 | ||
本发明涉及语音处理领域,公开了一种语音处理方法、装置、计算机设备及存储介质。其方法包括:通过音频缓冲器缓存实时环境声音信号;检测所述实时环境声音信号是否包含指定关键词;若检测到所述实时环境声音信号包含所述指定关键词,则通过语音识别模型对所述实时环境声音信号进行识别,获得用户口语指令;将所述用户口语指令转化为机器逻辑指令;将所述机器逻辑指令发送到执行设备,以使执行设备执行所述机器逻辑指令。本发明提供的语音处理方法,可以克服现有技术中唤醒和语音识别不同步,实时对用户的语音指令进行识别,提高了用户体验。
技术领域
本发明涉及语音处理领域,尤其涉及一种语音处理方法、装置、计算机设备及存储介质。
背景技术
现有的一部分语音识别系统,是依赖于语音进行激活的。这种语音交互系统,往往依赖于对用户语音中的关键词进行识别。例如,一具有语音交互功能的智能音箱,其设置的唤醒关键词为“Hello”,当用户在智能音箱附近说出“Hello”,智能音箱的语音识别模块在关键词监测模式下监测到该“Hello”语音,然后将语音识别模块切换工作模式(从关键词监测模式切换为语音识别模式),监听用户发出的语音指令(语音指令可以用于命令智能音箱打开音乐或播报新闻等)。
然而,在现有的语音识别过程中,关键词识别与语音指令识别之间存在一定的时间间隔(切换工作模式需要一定时间),导致用户在连续说出唤醒关键词与语音指令时,语音指令无法被正确识别(因为此时语音识别模式尚未启用)。虽然,在时间间隔内,可以通过播放一个简短的铃声或者产生一些视觉反馈来通知用户设备已经完成加载,可以使用语音指令进行下一步操作。然而,这种时间间隔产生的停顿在语音的自然流中产生中断,对用户体验的质量产生负面影响。
发明内容
基于此,有必要针对上述技术问题,提供一种语音处理方法、装置、计算机设备及存储介质,以克服现有技术中,唤醒和语音识别不同步,导致用户体验不佳的问题。
一种语音处理方法,包括:
通过音频缓冲器缓存实时环境声音信号;
检测所述实时环境声音信号是否包含指定关键词;
若检测到所述实时环境声音信号包含所述指定关键词,则通过语音识别模型对所述实时环境声音信号进行识别,获得用户口语指令;
将所述用户口语指令转化为机器逻辑指令;
将所述机器逻辑指令发送到执行设备,以使执行设备执行所述机器逻辑指令。
一种语音处理装置,包括:
缓存模块,用于通过音频缓冲器缓存实时环境声音信号;
检测模块,用于检测所述实时环境声音信号是否包含指定关键词;
识别模块,用于若检测到所述实时环境声音信号包含所述指定关键词,则通过语音识别模型对所述实时环境声音信号进行识别,获得用户口语指令;
指令转化模块,用于将所述用户口语指令转化为机器逻辑指令;
执行模块,用于将所述机器逻辑指令发送到执行设备,以使执行设备执行所述机器逻辑指令。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述语音处理方法。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述语音处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910390372.2/2.html,转载请声明来源钻瓜专利网。