[发明专利]一种语音指令的执行方法、装置及电子设备有效
申请号: | 201910766037.8 | 申请日: | 2019-08-19 |
公开(公告)号: | CN110335607B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 杜国威 | 申请(专利权)人: | 北京安云世纪科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 王玉双 |
地址: | 100028 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 指令 执行 方法 装置 电子设备 | ||
1.一种语音指令的执行方法,其特征在于,包括:
在同时接收到至少两个声源对象发出的语音指令时,确定所述至少两个声源对象的位置;
根据所述至少两个声源对象的位置对所述至少两个声源对象进行图像采集,获取至少一帧声源图像;
在所述至少一帧声源图像中具有第一指向性特征时,基于所述第一指向性特征确定目标声源对象,所述第一指向性特征用于指示所述目标声源对象的位置;
执行所述目标声源对象发出的语音指令;
所述第一指向性特征包括至少一个声源对象的第一指向性手势;
所述基于所述第一指向性特征确定目标声源对象,包括:
根据所述第一指向性手势指向的位置,确定所述目标声源对象;
所述根据所述第一指向性手势指向的位置,确定所述目标声源对象,包括:
在第一指向性特征指向多个声源对象的情况下,获取指向每一个所述声源对象的位置的所述第一指向性手势的数量;
获取所述第一指向性手势数量最多的第一位置;
将所述第一位置处的所述声源对象确定为所述目标声源对象。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第一指向性手势指向的位置,确定所述目标声源对象,包括:
在预设时间长度内的多帧声源图像;分别获取所述第一指向性手势指向每一个所述声源对象的位置的帧数;
获取所述第一指向性手势指向同一位置帧数最多的第二位置;
将所述第二位置处的声源对象确定为所述目标声源对象。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一指向性手势指向的位置,确定所述目标声源对象,包括:
在预设帧数的所述声源图像中,获取所述第一指向性手势指向所述声源对象的位置时的移动距离;
获取所述移动距离最大的所述第一指向性手势指向的第三位置;
将所述第三位置处的所述声源对象确定为所述目标声源对象。
4.根据权利要求1所述的方法,其特征在于,所述在同时接收到至少两个声源对象发出的语音指令时,确定所述至少两个声源对象的位置之后,所述方法还包括:
将所述语音指令转化为文字信息并显示。
5.根据权利要求4所述的方法,其特征在于,所述将所述语音指令转化为文字信息并显示之后,所述方法还包括:
对所述文字信息添加声源对象标识。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述在同时接收到至少两个声源对象发出的语音指令时,确定所述至少两个声源对象的位置之前,所述方法还包括:
采集周围环境的环境图像;
在所述环境图像中具有第二指向性特征时,执行接收所述语音指令的步骤。
7.根据权利要求6所述的方法,其特征在于,所述第二指向性特征包括,指向所述执行主体的第二指向性手势。
8.根据权利要求6所述的方法,其特征在于,所述第二指向性特征包括,指向所述执行主体之外的第三指向性手势;
所述接收至少两个声源对象发出的语音指令,确定所述至少两个声源对象的位置之后,所述方法还包括:
掩蔽所述第三指向性手势指示方向的预设范围之外的声源对象发出的语音指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京安云世纪科技有限公司,未经北京安云世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910766037.8/1.html,转载请声明来源钻瓜专利网。