[发明专利]3D场景中基于最小费用最大流的层次结构构建方法有效
申请号: | 201810689206.8 | 申请日: | 2018-06-28 |
公开(公告)号: | CN108921938B | 公开(公告)日: | 2020-06-19 |
发明(设计)人: | 赵玺;杨新宇;苏振强;刘鹏康;杜妍;骆志伟 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06T17/00 | 分类号: | G06T17/00 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 场景 基于 最小 费用 最大 层次 结构 构建 方法 | ||
本发明公开了一种3D场景的基于最小费用最大流的层次结构构建方法。发明首先在几何信息的基础上融合场景的label信息,通过重复率和覆盖率找到场景基本重复单元。然后根据基本重复单元找到场景中的重复结构,本发明将寻找场景重复结构的问题转化为最小费用最大流的问题。将重复结构作为根节点的子节点,建立了包含重复结构的局部场景的层次结构。对于场景中未包含重复结构的部分,使用最小生成树建立层次结构。最后,将两部分的层次结构综合起来构建成最终的场景层次结构。
技术领域
本发明涉及一种3D场景中基于最小费用最大流的层次结构构建方法。
背景技术
近年来,随着深度摄像头和3D扫描仪的快速发展,人们获取3D数据越来越容易。3D数据的类型包括深度数据、点云数据、3D模型等。对于有标注的3D模型,计算机能够很好的识别场景中的物体。但是3D场景并不仅仅是单个物体的简单集合,缺乏对场景中各个物体之间关系的描述,会成为计算机对场景高层次理解或者进一步使用的障碍。为了解决这个问题,之前的做法很多都是依赖单个对象的label和它们之间关系的平面图(flattengraph)。这种类型的图结构已经广泛应用于场景建模,基于上下文的对象检索,场景检索等。但通常这类平面图缺乏针对组或局部区域的表示,往往需要进行分割或特征提取等进一步处理才能够用于比较和检索。分层结构既包含了场景中的物体、物体间的关系,又对场景中的局部结构有更清晰地表示,已被广泛用于模型分析。层次结构已经被证明在场景解析,场景检索和基于功能的对象检索中非常有用。Liu等人提出了一种基于学习的算法。虽然他们的系统可以产生一致的场景层次,但是训练需要大量的人工标签。Zhao等人提出了基于对象之间的亲密度测量的分层凝聚聚类方算法法。该算法的合并速度由合并参数控制,然而该合并参数难以针对所有类型的数据进行优化。Hu等人为场景的每个中心对象构建分层结构,其中树的节点是单个对象。相比之下,他们的算法更适合小规模的场景。
对于已经分割为实体且有标注的3D场景,一种构建层次结构的方法是以每个实体或者模型为顶点构建场景的图,利用基于图论的分割算法对场景迭代分割,构建场景的层次结构。这种方法在普通场景中能够获得较好的结果,但是当场景中包含多个具有相同语义的重复结构时,不能保证准确识别出这些重复结构。
发明内容
本发明的目的在于克服上述现有技术的缺点,提供一种3D场景中基于最小费用最大流的层次结构构建方法,能够快速找到场景的重复结构,构建场景的重复结构。
为达到上述目的,本发明采用以下技术方案予以实现:
步骤1,对于输入3D模型,本发明使用IBS算法计算各个模型之间的空间关系,构建整个场景的空间关系;
步骤2,根据各个模型之间的空间关系,融合场景的label信息,使用重复率和覆盖率找到场景的基本单元的构成;
步骤3,将重复单元中所有的对象按照label分为两组,费用流中也仅仅存在跨类别的边,同一label内的对象之间不存在边。在网络中假设一个原点s和t,运行最小费用最大流算法计算场景的最佳匹配,找到场景的基本单元及依据此基本单元的分割结果;
步骤4,对于除去重复单元的剩余部分,运用最小生成树算法将场景连成一棵树。求取任何两个值之间的斜率,找到斜率的峰值,也就是边的值变化最大的位置,即为阈值t的位置,将大于阈值t的边都去掉,就将剩余部分的场景给分割开来,即得到分割的结果;
步骤5,根据步骤3与步骤4的分割结果构建层次结构,得到最终的结果。
与现有技术相比,本发明具有以下有益效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810689206.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种手机拍照自动识别图片抠图方法
- 下一篇:一种基于图片的三维场景重建方法