[发明专利]基于正视的人机交互方法与系统有效
申请号: | 201710354064.5 | 申请日: | 2017-05-18 |
公开(公告)号: | CN107239139B | 公开(公告)日: | 2018-03-16 |
发明(设计)人: | 刘国华 | 申请(专利权)人: | 刘国华 |
主分类号: | G06F3/01 | 分类号: | G06F3/01;G06K9/00;H04N21/442 |
代理公司: | 广州华进联合专利商标代理有限公司44224 | 代理人: | 何平 |
地址: | 518026 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于正视的人机交互方法与系统,获取通过图像采集设备采集的用户与设备处于相对正视状态下的正视图像数据,采集用户当前图像数据,将当前采集的图像数据与正视图像数据比较,当一致时,通过计算机的视觉识别技术和语音识别技术识别用户行为和意图,根据预设用户的行为与意图与操作对应关系,控制设备执行与用户当前的行为与意图对应的操作。整个过程中,基于图像采集设备采集的图像数据进行正视判定,并以用户与设备的正视状态判定作为人机交互前提条件,整个人机交互过程自然,另外采用包括人脸识别、语音识别、手势识别、唇语识别、瞳孔识别以及虹膜识别的多种计算机的视觉识别技术和语音识别技术识别用户下一步动作,能够实现多样式人机交互。 | ||
搜索关键词: | 基于 正视 人机交互 方法 系统 | ||
【主权项】:
一种基于正视的人机交互方法,其特征在于,包括步骤:获取通过图像采集设备采集的用户与设备处于相对正视状态下的正视图像数据;通过所述图像采集设备实时采集用户当前图像数据,将当前采集的图像数据与所述正视图像数据比较;当所述当前采集的图像数据和所述正视图像数据一致时,判定用户与设备处于相对正视状态;当用户与设备处于相对正视状态时,通过计算机的视觉识别技术和语音识别技术识别用户行为和意图,根据预设用户的行为与意图与操作对应关系,控制设备执行与用户当前的行为与意图对应的操作,所述计算机的视觉识别技术和语音识别技术包括人脸识别、语音识别、语义理解、手势识别、唇语识别、声纹识别、表情识别、年龄识别、卡片识别、人脸跟踪、瞳孔识别以及虹膜识别;所述当所述当前采集的图像数据和所述正视图像数据一致时,判定用户与设备处于相对正视状态的步骤之前还包括:当侦测到用户时,定位所述用户的面部位置为音源位置;将声音采集设备正对所述音源位置;所述通过计算机的视觉识别技术和语音识别技术识别用户行为和意图,根据预设用户的行为与意图与操作对应关系,控制设备执行与用户当前的行为与意图对应的操作的步骤包括:通过所述声音采集设备采集用户声音数据,当采集的用户声音数据中携带有语音操作指令时,提取所述语音操作指令,控制设备执行与所述语音操作指令对应操作。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于刘国华,未经刘国华许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710354064.5/,转载请声明来源钻瓜专利网。