[发明专利]一种语音唤醒方法及电子设备有效
申请号: | 202010063473.1 | 申请日: | 2020-01-20 |
公开(公告)号: | CN111276142B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 靳源;冯大航;常乐 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/24 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;黄灿 |
地址: | 100098 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 唤醒 方法 电子设备 | ||
1.一种语音唤醒方法,应用于包括摄像头的电子设备,其特征在于,所述方法包括:
获取所述摄像头采集的第一图像;
在识别到所述第一图像中包括人脸图像的情况下,获取所述人脸图像对应的对象的位置信息;
根据所述位置信息,调整所述电子设备的唤醒阈值;
基于调整后的唤醒阈值,控制所述电子设备响应用户的语音唤醒指令;
所述获取所述人脸图像对应的对象的位置信息,包括:获取所述人脸图像在所述第一图像中的坐标位置信息;或者,获取所述人脸图像对应的对象相对于所述电子设备的直线距离;
所述根据所述位置信息,调整所述电子设备的唤醒阈值,包括:
基于所述坐标位置信息,获取所述人脸图像对应的对象相对于所述电子设备中心的偏移距离;根据目标距离,调整所述电子设备的唤醒阈值,其中,所述目标距离为所述偏移距离;或者,
根据目标距离,调整所述电子设备的唤醒阈值,其中,所述目标距离为所述直线距离。
2.根据权利要求1所述的方法,其特征在于,所述根据目标距离,调整所述电子设备的唤醒阈值,包括:
在所述目标距离小于或等于第一距离阈值的情况下,调整所述电子设备的唤醒阈值为第一唤醒阈值;
在所述目标距离大于所述第一距离阈值且小于或等于第二距离阈值的情况下,调整所述电子设备的唤醒阈值为第二唤醒阈值,其中,所述第二距离阈值大于所述第一距离阈值,所述第二唤醒阈值高于所述第一唤醒阈值;
在所述目标距离大于所述第二距离阈值的情况下,调整所述电子设备的唤醒阈值为第三唤醒阈值,其中,所述第三唤醒阈值高于所述第二唤醒阈值。
3.根据权利要求1所述的方法,其特征在于,所述在识别到所述第一图像中包括人脸图像的情况下,获取所述人脸图像对应的对象的位置信息,包括:
识别所述第一图像中的对象,确定所述第一图像的类别,所述类别包括人物类或者非人物类;
在确定所述第一图像的类别为人物类的情况下,返回所述第一图像中的人物对象的人脸位置信息。
4.一种电子设备,包括摄像头,其特征在于,所述电子设备还包括:
第一获取模块,用于获取所述摄像头采集的第一图像;
第二获取模块,用于在识别到所述第一图像中包括人脸图像的情况下,获取所述人脸图像对应的对象的位置信息;
调整模块,用于根据所述位置信息,调整所述电子设备的唤醒阈值;
唤醒模块,用于基于调整后的唤醒阈值,控制所述电子设备响应用户的语音唤醒指令;
所述第二获取模块具体用于获取所述人脸图像在所述第一图像中的坐标位置信息;或者获取所述人脸图像对应的对象相对于所述电子设备的直线距离;
所述调整模块包括:
计算单元,用于基于所述坐标位置信息,获取所述人脸图像对应的对象相对于所述电子设备中心的偏移距离;
调整单元,用于根据目标距离,调整所述电子设备的唤醒阈值,其中,所述目标距离为所述偏移距离;
或者,所述调整模块用于根据目标距离,调整所述电子设备的唤醒阈值,其中,所述目标距离为所述直线距离。
5.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至3中任一项所述的语音唤醒方法中的步骤。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至3中任一项所述的语音唤醒方法中的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010063473.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:补光灯组件及电子设备
- 下一篇:区块链层次化数据交换方法、装置和计算机设备