[发明专利]对标记有属性的对象进行聚类的方法和系统有效
| 申请号: | 201580084335.9 | 申请日: | 2015-10-12 |
| 公开(公告)号: | CN108351971B | 公开(公告)日: | 2022-04-22 |
| 发明(设计)人: | 王晓刚;欧阳万里;李弘扬;曾星宇 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
| 主分类号: | G06V10/762 | 分类号: | G06V10/762;G06V10/764;G06V10/82;G06K9/62 |
| 代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;王艳春 |
| 地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 标记 属性 对象 进行 方法 系统 | ||
公开了一种对标记有属性的对象进行聚类的方法,包括:获得多个对象的属性;将所获得的属性汇总为多个语义因子;将所述对象拆分为多于一个集群;以及将所述集群中的至少一个集群拆分一次或多次,其中从所述语义因子中独立地选择一个语义因子以在每次拆分期间拆分所述集群。本公开进一步公开了一种对标记有属性的对象进行聚类的系统。本公开还公开了一种使用所述对标记有属性的对象进行聚类的方法来进行特征学习方法,以及公开了一种特征学习系统。
技术领域
本申请涉及一种在对象检测装置的特征学习系统中对标记有属性的对象进行聚类的方法和系统。
背景技术
随着深度学习技术的出现,根据大规模监督来学习强特征表示已经实现了计算机视觉的巨大成功,这是由具有丰富标注的大视觉数据来驱动的。
近年来已经构造了许多属性数据集。Sun属性数据库用于场景辨识。其它数据集从不同方面描述对象的属性。还存在按照每个样本都提供了属性的许多数据集。
许多方法使用属性的预测作为中间级别特征,以用于辨识具有很少实例或没有实例的新对象范畴。人们旨在改进属性预测的准确性。人们还发现属性对于对象检测是有效的。已经提出了使用片段(segment)的功能(functionality)、上位范畴(superordinatecategory)、视点和位姿作为属性来改进检测准确性。然而,并不清楚这些属性是否有助于以深度模型学习一般特征表示,且尚不清楚这些属性是否有助于对比如ImageNet的极大规模数据集的对象检测。
已经表明深度学习对大规模对象检测和辨识是有效的。已发现,从大规模分类数据学习的特征可应用于许多其它视觉任务。然而,现有技术中未研究使用属性来改进用于对象检测的特征学习。
发明内容
基于ImageNet的对象检测数据集,本申请标注了旋转、视点、对象部分位置、部分遮挡、部分存在、共同属性和类别特定属性。因而,本申请提出使用此数据集来训练深度表示(representation),且广泛地评估这些属性对一般对象检测任务的有用程度。为了较佳地使用属性标注,通过对属性的关系建模且将属性以分层方式聚类为语义上有意义的混合类型来提出深度学习方案。
在本公开的一个方面中,提供了一种对标记有属性的对象进行聚类的方法,包括:
获得多个对象的属性;
将所获得的属性汇总为多个语义因子;
将对象拆分为多于一个集群;以及
对集群中的至少一个集群拆分一次或多次,
其中,从语义因子中独立地选择一个语义因子以在每次拆分期间拆分集群。
在一个实施方式中,将所述对象划分为多于一个对象类别,且对每个对象类别单独地执行所述获得、所述汇总和所述拆分的处理。
在一个实施方式中,所述属性被汇总为以下语义因子中的一个或多个:
旋转属性,即,对象的平面内旋转;
视点属性,即,对象的平面外旋转;
共同属性,所有所述对象类别共享的属性;
类别特定属性,其特定地用于单个类别或小类别群组;
对象部分位置和遮挡;以及
对象部分存在。
在一个实施方式中,任何一个所述集群的、由用于从所有对象的集合获得集群的拆分次数所界定的深度不大于最大深度;或者任何一个所述集群的、由集群中的对象数目所界定的大小不小于最小大小。
在一个实施方式中,每个所述语义因被选择使得所述拆分的处理具有最佳的均一性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580084335.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:毛发直径测量
- 下一篇:用于表示生物的解剖学形状的设备和方法





