[发明专利]自动捕捉目标物的系统和方法在审
| 申请号: | 201510537481.4 | 申请日: | 2015-08-27 |
| 公开(公告)号: | CN105205454A | 公开(公告)日: | 2015-12-30 |
| 发明(设计)人: | 刘国华 | 申请(专利权)人: | 深圳市国华识别科技开发有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00 |
| 代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 何平 |
| 地址: | 518026 广东省深圳市福田区*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 自动 捕捉 目标 系统 方法 | ||
技术领域
本发明涉及计算机识别技术,特别是涉及一种自动捕捉目标物的系统和方法。
背景技术
人工智能(ArtificialIntelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。随着计算机科学的发展,越来越多的智能产品开始问世。
然而,现有的智能产品还局限于对简单的图像、语音进行识别,当需要对多个目标物中的某一个或对一个目标物中的某一个部位进行识别时,识别的准确率会大大地降低,也影响了智能产品与用户的交互性能。比如,在人机交互时,人问智能产品“这是什么?”、“看这里”,智能产品不理解“这”、“这里”是什么意思,即不能准备捕捉“这”所指代的目标物。
发明内容
基于此,有必要提供一种可以提高识别准确度和交互性能的自动捕捉目标物的系统和方法。
一种自动捕捉目标物的系统,包括:
图像采集模块,用于采集包含有用户手势和目标物的图像;
手势识别模块,用于识别用户手势并输出手势识别结果,所述手势识别结果为手拿物体的手势或手指向物体的手势;
图像识别模块,用于根据所述手势识别结果确定目标物的位置、识别目标物,并输出图像识别结果;
交互模块,用于根据所述图像识别结果与用户进行交互。
在其中一个实施例中,所述图像识别模块包括:
目标物捕捉单元,用于根据所述手势识别结果确定目标物的位置;
图像处理单元,用于提取目标物的图像特征;
图像识别单元,用于将目标物的图像特征与预存的模版特征进行比较以获取目标物信息;
结果输出单元,用于输出所述目标物信息作为图像识别结果。
在其中一个实施例中,所述目标物为单独个体或为单独个体中的一个部分。
在其中一个实施例中,还包括:
语音采集模块,用于采集用户语音;
语音识别模块,用于识别用户的语音并输出语音识别结果;
所述交互模块还用于根据所述图像识别结果和所述语音识别结果与用户进行交互。
在其中一个实施例中,所述交互模块包括显示单元和/或语音播放单元;其中,
所述显示单元用于显示所述图像识别结果;
所述语音播放单元用于播放所述图像识别结果。
一种自动捕捉目标物的方法,包括:
采集包含有用户手势和目标物的图像;
识别用户手势并输出手势识别结果,所述手势识别结果为手拿物体的手势或手指向物体的手势;
根据所述手势识别结果确定目标物的位置、识别目标物,并输出图像识别结果;
根据所述图像识别结果与用户进行交互。
在其中一个实施例中,所述根据所述手势识别结果确定目标物的位置、识别目标物,并输出图像识别结果的步骤,包括:
根据所述手势识别结果确定目标物的位置;
提取目标物的图像特征;
将目标物的图像特征与预存的模版特征进行比较以获取目标物信息;
输出所述目标物信息作为图像识别结果。
在其中一个实施例中,所述目标物为单独个体或为单独个体中的一个部分。
在其中一个实施例中,还包括:
采集用户语音;
识别用户的语音并输出语音识别结果;
所述根据所述图像识别结果与用户进行交互的步骤具体为:
根据所述图像识别结果和所述语音识别结果与用户进行交互。
在其中一个实施例中,所述根据所述图像识别结果与用户进行交互的步骤包括显示所述图像识别结果的步骤和/或包括播放所述图像识别结果的步骤。
上述自动捕捉目标物的系统和方法,通过图像采集模块采集包含有用户手势和目标物的图像,手势识别模块识别用户手势并输出手势识别结果,图像识别模块根据所述手势识别结果确定目标物的位置、识别目标物,并输出图像识别结果,交互模块根据所述图像识别结果与用户进行交互,这样即使需要对多个目标物中的一个或对一个目标物中的某一个部位进行识别,也可以根据用户的手势准确地捕捉到目标物,然后再对目标物进行识别并与用户进行交互,提高了识别的准确率和交互性能。
附图说明
图1为一实施例中自动捕捉目标物的系统的模块图;
图2为用户手势的示意图之一;
图3为用户手势的示意图之二;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市国华识别科技开发有限公司,未经深圳市国华识别科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510537481.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种不锈钢冶炼用AOD炉
- 下一篇:一种基于驾驶人眼动特征的交通冲突识别方法





