[发明专利]智能设备的唤醒方法、装置、电子设备及介质在审
| 申请号: | 202010345765.4 | 申请日: | 2020-04-27 |
| 公开(公告)号: | CN111554288A | 公开(公告)日: | 2020-08-18 |
| 发明(设计)人: | 陈都;李家魁;吕安超;李宝祥 | 申请(专利权)人: | 北京猎户星空科技有限公司 |
| 主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/20;G10L15/16;G10L15/06 |
| 代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 路晓丹 |
| 地址: | 100025 北京市朝*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 智能 设备 唤醒 方法 装置 电子设备 介质 | ||
本申请公开了一种智能设备的唤醒方法、装置、电子设备及介质。该方法获取智能设备采集的语音信号,确定语音信号中包含唤醒词的唤醒概率;获取语音信号的目标特征信息,输入至预先训练的阈值模型,确定目标特征信息对应的目标唤醒阈值;若语音信号的唤醒概率大于目标唤醒阈值,则唤醒智能设备。该方法提高了智能设备的唤醒率且降低了误唤醒率,从而提高了用户体验。
技术领域
本申请涉及语音处理技术领域,尤其涉及一种智能设备的唤醒方法、装置、电子设备及介质。
背景技术
目前,智能设备的种类越来越多,应用也越来越广泛。智能设备通常包括智能机器人、智能音箱等。
现有的智能设备上可以安装语音唤醒模型,智能设备接收到用户发送的特定唤醒词,如“小豹小豹”或“小贝小贝”后切换至唤醒状态,之后智能设备才能识别用户发送的语音指令,并播放用户所请求的多媒体资源。现有智能音箱、智能空调等智能设备上的语音唤醒模型一般是统一发布的,即语音唤醒模型具有相同的固定语音唤醒阈值。语音唤醒阈值用于供电子设备判定是否根据唤醒词执行语音唤醒操作。当携带唤醒词的语音信号通过声学模型得到唤醒词的声学得分大于语音唤醒阈值时,执行语音唤醒操作;当唤醒词的声学得分小于语音唤醒阈值时,不执行语音唤醒操作。
然而,对于不同声学场景,如环境中噪声的大小,音响喇叭是否处于播放状态、存在回声等声学场景,现有的语音唤醒模型难以适应,导致对于某种声学场景来说,该声学场景下的唤醒率较低且误唤醒率较高,降低了用户体验。
发明内容
本申请实施例提供一种智能设备的唤醒方法、装置、电子设备及介质,解决了现有技术存在的上述问题,在不同声学场景下,提高了智能设备的唤醒率且降低了误唤醒率,从而提高了用户体验。
第一方面,提供了一种智能设备的唤醒方法,该方法可以包括:
获取智能设备采集的语音信号;
确定所述语音信号中包含唤醒词的唤醒概率;
获取所述语音信号的目标特征信息,输入至预先训练的阈值模型,确定所述目标特征信息对应的目标唤醒阈值;
若所述语音信号的唤醒概率大于所述目标唤醒阈值,则唤醒所述智能设备。
在一个可选的实现中,确定所述目标特征信息对应的目标唤醒阈值之前,所述方法还包括:
将所述唤醒概率与预设阈值进行比较,所述预设阈值小于所述阈值模型对应的任一唤醒阈值;
若所述唤醒概率大于所述预设阈值,则执行获取所述语音信号的目标特征信息的步骤。
在一个可选的实现中,所述语音信号的目标特征信息包括以下信息中的至少一种:
所述语音信号中所述唤醒词对应的第一语音片段之前的预设长度的第二语音片段的目标特征信息;
所述语音信号中所述唤醒词对应的第一语音片段的目标特征信息;
表征所述第一语音片段的目标特征信息与所述第二语音片段的目标特征信息的差异的信息。
在一个可选的实现中,所述第一语音片段的目标特征信息包括:所述第一语音片段的声能量和所述第一语音片段的唤醒概率中的至少一种;
和/或所述第二语音片段的目标特征信息包括:所述第二语音片段的声能量、所述第二语音片段中静音帧的比例和所述第二语音片段的唤醒概率中的至少一种。
在一个可选的实现中,所述阈值模型的训练过程包括:
获取包含唤醒词的语音训练样本;
确定各所述语音训练样本的目标特征信息、以及所述语音训练样本对应的训练标签;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京猎户星空科技有限公司,未经北京猎户星空科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010345765.4/2.html,转载请声明来源钻瓜专利网。





