[发明专利]人机交互方法、装置、存储介质及智能终端有效
申请号: | 201810645687.2 | 申请日: | 2018-06-21 |
公开(公告)号: | CN108766438B | 公开(公告)日: | 2020-12-01 |
发明(设计)人: | 陈彪 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L17/22;H04N5/232;G06F3/01;G01S5/18 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人机交互 方法 装置 存储 介质 智能 终端 | ||
1.一种人机交互方法,其特征在于,包括:
检测到第一语音信号时,对所述第一语音信号对应的第一声源进行定位;
若所述第一声源的定位结果满足预设要求,则启动摄像头,并通过所述摄像头检测人眼是否对准终端;
若检测到人眼对准终端,则启动人机交互模式并响应所述第一语音信号对应的语音指令;
记录所述第一语音信号对应的第一声纹信息,关闭摄像头;
当检测到所述第一声纹信息对应的第二语音信号时,确定所述第一声纹信息对应的第一声源的移动速度;
若所述移动速度小于预设速度阈值,则响应所述第二语音信号对应的语音指令。
2.根据权利要求1所述的方法,其特征在于,所述对所述第一语音信号对应的第一声源进行定位,包括:
通过声音定位技术,确定所述第一语音信号对应的第一声源相对于终端的距离与方向;
相应的,所述若所述第一声源的定位结果满足预设要求,则启动摄像头,并通过所述摄像头检测人眼是否对准终端,包括:
若所述第一声源相对于所述终端的距离小于预设距离阈值,则依据所述第一声源相对于所述终端的方向启动摄像头,并通过所述摄像头检测人眼是否对准终端。
3.根据权利要求1所述的方法,其特征在于,还包括:
检测到所述第一语音信号时,获取所述第一语音信号对应的语音内容;
相应的,所述响应所述第一语音信号对应的语音指令,包括:
依据所述语音内容生成语音指令,并响应所述语音指令。
4.根据权利要求1所述的方法,其特征在于,所述确定所述第一声纹信息对应的第一声源的移动速度,包括:
获取第一时刻与第二时刻的时间间隔,其中,所述第一时刻包括检测到所述第一语音信号的时刻,所述第二时刻包括检测到所述第二语音信号的时刻;
获取所述第一声源在所述第一时刻和所述第二时刻相对于所述终端的距离差;
根据所述时间间隔和所述距离差计算所述第一声纹信息对应的第一声源的移动速度。
5.根据权利要求1所述的方法,其特征在于,所述启动人机交互模式并响应所述第一语音信号对应的语音指令之后,还包括:
记录所述第一语音信号对应的第一声纹信息,关闭摄像头;
当检测到所述第一声纹信息对应的第三语音信号时,若判断出当前时刻与第三时刻的时间间隔大于所述第一声纹信息的有效时长,则对所述第三语音信号进行定位,若定位结果满足预设要求,则启动所述摄像头,并通过所述摄像头重新进行人眼检测;
其中,所述第三时刻包括上一次检测到所述第一声纹信息对应的语音信号的时刻,所述第一声纹信息的有效时长包括最近两次检测到所述第一声纹信息对应的语音信号的时间间隔。
6.根据权利要求1所述的方法,其特征在于,所述启动人机交互模式并响应所述第一语音信号对应的语音指令之后,还包括:
控制摄像头采集第一语音信号对应的人脸图像作为目标人脸图像并记录;
若检测到的第四语音信号的声纹信息为第二声纹信息,且所述摄像头检测到人眼对准终端设备,则控制摄像头采集所述第四语音信号对应的人脸图像,并将所述人脸图像与记录的目标人脸图像进行匹配;
若不匹配,则响应所述第四语音信号对应的语音指令,并将所述第四语音信号对应的人脸图像作为目标人脸信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810645687.2/1.html,转载请声明来源钻瓜专利网。