[发明专利]从图像中识别物体的方法和装置有效
| 申请号: | 201210077223.9 | 申请日: | 2012-03-21 |
| 公开(公告)号: | CN103324949A | 公开(公告)日: | 2013-09-25 |
| 发明(设计)人: | 郝凯;陈克 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06K9/66 | 分类号: | G06K9/66 |
| 代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 吴贵明;江舟 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 图像 识别 物体 方法 装置 | ||
1.一种从图像中识别物体的方法,其特征在于,包括:
在待检测图像的不同抽取位置上获取对应的特征向量;
在预先建立的检索树中查找到与每一个所述特征向量最相似的一个节点上的训练特征向量,其中,所述检索树中的每一个节点上具有由预定数量的训练特征向量聚类得到的一个训练特征向量;
获取每一个所述查找到的训练特征向量所属的物体类别以及所述训练特征向量所对应的位置与物体中心之间的相对位置关系;
对每一个所述特征向量,根据与该特征向量对应的所述训练特征向量与物体中心之间的相对位置关系以及该特征向量对应的所述抽取位置的坐标得到在该训练特征向量所对应的物体类别的投票图像上物体中心的估计位置,其中,每一个待识别的物体类别对应一张投票图像;
统计每一张所述投票图像上每个点作为物体中心的估计位置的次数,当所述投票图像上的一个点作为物体中心的次数大于预定阈值时,则判断出所述待检测图像上存在该投票图像所对应的物体类别的物体。
2.根据权利要求1所述的方法,其特征在于,通过以下步骤建立所述检索树:
从第一检测图像库中提取预定数量的用于建立所述检索树的图像,提取每一个用于建立所述检索树的图像中的局部特征向量;
对所有局部特征向量执行聚类操作得到多个聚类中心,将所述检索树的第一层节点设置为与所述多个聚类中心一一对应;
对所述检索树中每一层上的每个节点对应的聚类中心进行聚类操作,将聚类得到的聚类中心设置为与该节点的子节点一一对应;
对所述检索树进行训练操作。
3.根据权利要求2所述的方法,其特征在于,对所述检索树进行训练操作的步骤包括:
从第二检测图像库中提取预定数量的用于训练所述检索树的图像,提取每一个用于训练所述检索树的图像中的训练特征向量、该训练特征向量所属的物体类别以及该训练特征向量所对应的与物体中心之间的相对位置关系;
在所述检索树中查找与每一个所述训练特征向量最相似的一个节点,并将该训练特征向量、该训练特征向量所属的物体类别以及该训练特征向量所对应的位置与物体中心之间的相对位置关系设置在该最相似的一个节点上。
4.根据权利要求1所述的方法,其特征在于,在预先建立的检索树中查找到与每一个所述特征向量最相似的一个节点上的训练特征向量的步骤包括:
逐层判断每一个所述特征向量与所述预先建立的检索树上每一层的节点上的训练特征向量的相似度;
若相似度大于预定阈值,则该相似度对应的节点为与该特征向量最相似的一个节点,并获取该节点上的训练特征向量。
5.根据权利要求1所述的方法,其特征在于,所述检索树包括:高度为(h+1)的k叉树,其中,h和k均为自然数。
6.一种从图像中识别物体的装置,其特征在于,包括:
第一获取单元,用于在待检测图像的不同抽取位置上获取对应的特征向量;
查找单元,用于在预先建立的检索树中查找到与每一个所述特征向量最相似的一个节点上的训练特征向量,其中,所述检索树中的每一个节点上具有由预定数量的训练特征向量聚类得到的一个训练特征向量;
第二获取单元,用于获取每一个所述查找到的训练特征向量所属的物体类别以及所述训练特征向量所对应的位置与物体中心之间的相对位置关系;
确定单元,用于对每一个所述特征向量,根据与该特征向量对应的所述训练特征向量与物体中心之间的相对位置关系以及该特征向量对应的所述抽取位置的坐标,得到在该训练特征向量所对应的物体类别的投票图像上物体中心的估计位置,其中,每一个待识别的物体类别对应一张投票图像;
统计单元,用于统计每一张所述投票图像上每个点作为物体中心的估计位置的次数,当所述投票图像上的一个点作为物体中心的次数大于预定阈值时,则判断出所述上存在该投票图像所对应的物体类别的物体。
7.根据权利要求6所述的装置,其特征在于,还包括建立单元,用于建立所述检索树。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210077223.9/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





