[发明专利]语音唤醒的方法、装置、电子设备及计算机可读存储介质在审
| 申请号: | 201811006300.5 | 申请日: | 2018-08-30 |
| 公开(公告)号: | CN109065046A | 公开(公告)日: | 2018-12-21 |
| 发明(设计)人: | 李深;胡亚光 | 申请(专利权)人: | 出门问问信息科技有限公司 |
| 主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L25/18;G10L15/16 |
| 代理公司: | 北京市立方律师事务所 11330 | 代理人: | 张筱宁 |
| 地址: | 100007 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 频谱特征 置信度 关键词检测 信息对应 计算机可读存储介质 电子设备 检测结果 用户语音 唤醒 语音 语音识别技术 计算开销 信息输入 采集 应用 | ||
本发明实施例提供了一种语音唤醒的方法、装置、电子设备及计算机可读存储介质,应用于语音识别技术领域。该方法包括:从采集到用户语音中提取频谱特征信息,然后将频谱特征信息输入至第一关键词检测模型,得到频谱特征信息对应的第一置信度,若频谱特征信息对应的第一置信度不小于第一置信度阈值,则将频谱特征信息以及频谱特征信息对应的第一置信度输入至第二关键词检测模型,得到检测结果,第一置信度阈值为第一关键词检测模型对应的置信度阈值,然后基于检测结果,确定是否执行语音唤醒操作。本发明实施例实现了降低对用户语音进行关键词检测的计算开销。
技术领域
本发明实施例涉及语音识别技术领域,具体而言,本发明实施例涉及一种语音唤醒的方法、装置、电子设备及计算机可读存储介质。
背景技术
随着信息技术的发展,语音识别技术也随之发展,利用语音识别的产品越来越多,例如,会话助理、智能机器人、智能手表等。这些产品都是通过语音识别来增强用户体验和提高自然人机交互的水平。在语音识别中,一种非常重要的技术就是关键词检测,一般也可以成为语音唤醒。
现有技术中进行语音唤醒的方式为通过预设关键词检测模型,对采集到的用户语音进行关键词检测,当采集到的用户语音中存在目标关键词时,实现语音唤醒。
然而,在进行发明创造的过程中发明人发现,当通过现有的预设关键词检测模型实现语音唤醒时,由于用户所有的语音均需要预设关键词检测模型进行关键词检测,以确定是否执行语音唤醒操作,由于现有的预设关键词检测模型比较复杂,对用户语音进行关键词检测的计算量较大,从而导致计算量开销较大。
发明内容
本发明实施例提供了一种语音唤醒的方法、装置、电子设备及计算机可读存储介质,用于解决对用户语音进行关键词检测的计算开销较大的问题。
为了解决上述问题,本发明实施例主要提供如下技术方案:
第一方面,提供了一种语音唤醒的方法,该方法包括:
从采集到用户语音中提取频谱特征信息;
将所述频谱特征信息输入至第一关键词检测模型,得到所述频谱特征信息对应的第一置信度;
若所述频谱特征信息对应的第一置信度不小于第一置信度阈值,则将所述频谱特征信息以及所述频谱特征信息对应的第一置信度输入至第二关键词检测模型,得到检测结果,第一置信度阈值为第一关键词检测模型对应的置信度阈值;
基于检测结果,确定是否执行语音唤醒操作。
第二方面,提供了一种语音唤醒的的装置,该装置包括:
提取模块,用于从采集到用户语音中提取频谱特征信息;
第一输入模块,用于将所述提取模块提取到的频谱特征信息输入至第一关键词检测模型,得到所述频谱特征信息对应的第一置信度;
第二输入模块,用于当所述频谱特征信息对应的第一置信度不小于第一置信度阈值时,将所述提取模块提取到的频谱特征信息以及所述频谱特征信息对应的第一置信度输入至第二关键词检测模型,得到检测结果,第一置信度阈值为第一关键词检测模型对应的置信度阈值;
确定模块,用于基于检测结果,确定是否执行语音唤醒操作。
第三方面,提供了一种电子设备,该电子设备包括:
至少一个处理器;
以及与所述处理器连接的至少一个存储器、总线;其中,
所述处理器、存储器通过所述总线完成相互间的通信;
所述处理器用于调用所述存储器中的程序指令,以执行第一方面所示的语音唤醒的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于出门问问信息科技有限公司,未经出门问问信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811006300.5/2.html,转载请声明来源钻瓜专利网。





