[发明专利]一种语音唤醒方法及电子设备有效
申请号: | 202010063473.1 | 申请日: | 2020-01-20 |
公开(公告)号: | CN111276142B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 靳源;冯大航;常乐 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/24 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;黄灿 |
地址: | 100098 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 唤醒 方法 电子设备 | ||
本发明提供一种语音唤醒方法及电子设备,该方法包括:获取摄像头采集的第一图像;在识别到所述第一图像中包括人脸图像的情况下,获取所述人脸图像对应的对象的位置信息;根据所述位置信息,调整所述电子设备的唤醒阈值;基于调整后的唤醒阈值,控制所述电子设备响应用户的语音唤醒指令。本发明实施例能够通过获取用户的位置信息,适应调整电子设备的唤醒阈值,可使语音唤醒方式较为灵活。
技术领域
本发明涉及语音处理技术领域,尤其涉及一种语音唤醒方法及电子设备。
背景技术
语音唤醒技术的应用领域较为广泛,例如手机、可穿戴设备、智能音箱、智能家居、车载等。几乎很多带有语音功能的设备,都会需要语音唤醒技术作为人机互动的一个开始或入口,不同的产品会有不同的唤醒词,用户可通过特定的唤醒词唤醒电子设备。
目前,在语音唤醒的过程中,为了避免误唤醒,往往会对唤醒语音的匹配精度要求较高,即通常会将唤醒阈值固定设为的较高的唤醒阈值,可见,这种唤醒方式不够灵活。
发明内容
本发明实施例提供一种语音唤醒方法及电子设备,以解决现有语音唤醒方式不够灵活的问题。
为解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供了一种语音唤醒方法,应用于包括摄像头的电子设备,其特征在于,所述方法包括:
获取所述摄像头采集的第一图像;
在识别到所述第一图像中包括人脸图像的情况下,获取所述人脸图像对应的对象的位置信息;
根据所述位置信息,调整所述电子设备的唤醒阈值;
基于调整后的唤醒阈值,控制所述电子设备响应用户的语音唤醒指令。
可选的,所述获取所述人脸图像对应的对象的位置信息,包括:
获取所述人脸图像在所述第一图像中的坐标位置信息;
所述根据所述位置信息,调整所述电子设备的唤醒阈值,包括:
基于所述坐标位置信息,获取所述人脸图像对应的对象相对于所述电子设备中心的偏移距离;
根据目标距离,调整所述电子设备的唤醒阈值,其中,所述目标距离为所述偏移距离。
可选的,所述获取所述人脸图像对应的对象的位置信息,包括:
获取所述人脸图像对应的对象相对于所述电子设备的直线距离;
所述根据所述位置信息,调整所述电子设备的唤醒阈值,包括:
根据目标距离,调整所述电子设备的唤醒阈值,其中,所述目标距离为所述直线距离。
可选的,所述根据目标距离,调整所述电子设备的唤醒阈值,包括:
在所述目标距离小于或等于第一距离阈值的情况下,调整所述电子设备的唤醒阈值为第一唤醒阈值,其中,所述目标距离为所述偏移距离或所述直线距离;
在所述目标距离大于所述第一距离阈值且小于或等于第二距离阈值的情况下,调整所述电子设备的唤醒阈值为第二唤醒阈值,其中,所述第二距离阈值大于所述第一距离阈值,所述第二唤醒阈值高于所述第一唤醒阈值;
在所述目标距离大于所述第二距离阈值的情况下,调整所述电子设备的唤醒阈值为第三唤醒阈值,其中,所述第三唤醒阈值高于所述第二唤醒阈值。
可选的,所述在识别到所述第一图像中包括人脸图像的情况下,获取所述人脸图像对应的对象的位置信息,包括:
识别所述第一图像中的对象,确定所述第一图像的类别,所述类别包括人物类或者非人物类;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010063473.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:补光灯组件及电子设备
- 下一篇:区块链层次化数据交换方法、装置和计算机设备