[发明专利]基于通用自适应3D模型的对象识别在审
申请号: | 201780076996.6 | 申请日: | 2017-11-21 |
公开(公告)号: | CN110199293A | 公开(公告)日: | 2019-09-03 |
发明(设计)人: | L·勒塞尔夫 | 申请(专利权)人: | 玛涅蒂马瑞利有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 魏子翔;杨晓光 |
地址: | 意大*** | 国省代码: | 意大利;IT |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像序列 初始数据集 三维模型 通用模型 图像 映射 机器学习系统 通用自适应 对象场景 对象识别 合成对象 三维对象 学习系统 自动配置 通用 数据集 组参数 可变 记录 投影 相机 合成 场景 | ||
本发明涉及一种用于自动配置用于识别可变形态的一类对象的系统的方法,包括以下步骤:向机器学习系统提供足以识别对象场景的图像序列中的一类对象的实例的初始数据集(10);提供特定于该类对象的通用三维模型,该类对象的形态可由一组参数定义;借助于相机(12)获取场景的图像序列;使用初始数据集识别所获取的图像序列中的该类对象的图像实例(14);采用所识别的图像实例(14)映射通用三维模型(16);记录由通用模型的映射产生的参数(20)的变化范围;基于通过改变所记录的变化范围中的参数的通用模型,合成多个三维对象(22);以及通过图像的平面中的合成对象(24)的投影来完成学习系统的数据集(10)。
技术领域
本发明涉及移动对象识别系统,特别涉及基于机器学习的系统。
背景技术
可以通过基于例如背景减法的相对简单的通用算法来执行图像序列中的运动对象的隔离和跟踪。另一方面,将如此隔离的对象分类为人们希望检测(即识别对象是否是人、汽车、自行车、动物等)的类别更加困难。实际上,对象可能具有序列图像中的各种形态(位置、大小、取向、失真、纹理、最终附件和明确元素的配置等)。形态还取决于视场和监视场景的相机镜头。有时也需要识别子类(汽车型号、人的性别)。
机器学习系统通常用于分类和检测对象。然后,分类基于通过学习获得的知识库或数据集。初始数据集通常在所谓的监督学习阶段期间生成,其中操作员查看在上下文中产生的图像序列并手动注释与要识别的对象相对应的图像区域。该阶段通常是漫长且乏味的,因为理想地寻求捕获该类对象的形态的所有可能的替代方案和至少充分的替代方案以获得令人满意的识别率。
为了减轻该监督学习的初始任务,已经提出了机器学习技术,其中,不是提供带有注释的真实图像的数据集,而是提供从要识别的对象的三维模型生成的自动注释的合成图像。在文章[2015年IEEE计算机视觉和模式识别会议(CVPR)由Hironori Hattori等人的“Learning Scene-Specific Pedestrian Detectors Without Real Data”]中描述了用于配置行人检测器的这种技术。在文章[2012年IEEE计算机视觉和模式识别会议(CVPR)由Bojan Pepik等人的“Teaching 3D Geometry to Deformable Part Models”]中描述了用于配置汽车检测器的类似技术。
这些技术的特征是它们生成许多合成图像,尽管它们符合3D模型的参数和约束,但具有不太可能的形态。这会使数据集与不必要的图像混乱,并且会减缓识别。
另外,一些对象具有这种可变形态,即难以用具有可管理数量的参数和约束的3D模型逼真地再现所有可能性。这导致数据集中的间隙和某些对象的检测缺失。
发明内容
通常提供一种用于自动配置用于识别具有可变形态的一类对象的系统的方法,包括以下步骤:向机器学习系统提供足以在对象场景的图像序列中识别该类对象的实例的初始数据集;提供特定于该类对象的通用三维模型,该类对象的形态可由一组参数定义;使用相机获取场景的图像序列;使用初始数据集识别所获取的图像序列中的该类对象的图像实例;使通用三维模型符合识别的图像实例;存储由通用模型的构造产生的参数的变化范围;通过改变存储的变化范围中的参数,从通用模型合成多个三维对象;以及采用图像的平面中的合成对象的投影来补充学习系统的数据集。
该方法可以进一步包括以下步骤:通过模型的网格的界标的相对位置来定义通用三维模型的参数,网格的其它节点的位置通过约束绑定到界标;以及通过将模型的投影的界标定位在图像的平面中来执行通用三维模型的构造。
该方法可以进一步包括如下步骤:存储来自识别的图像实例的区域的纹理;以及在每个合成对象上映射存储的纹理中的纹理。
学习系统的初始数据集可以通过涉及至少两个该类对象的监督学习获得,至少两个该类对象的形态处于观察到的形态的变化域的相对端处。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于玛涅蒂马瑞利有限公司,未经玛涅蒂马瑞利有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780076996.6/2.html,转载请声明来源钻瓜专利网。