[发明专利]基于全景图及多通道CNN的三维模型分类和检索方法有效
申请号: | 201810879211.5 | 申请日: | 2018-08-03 |
公开(公告)号: | CN109063139B | 公开(公告)日: | 2021-08-03 |
发明(设计)人: | 梁祺;聂为之 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06N3/04 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李林娟 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 全景 通道 cnn 三维 模型 分类 检索 方法 | ||
1.一种基于全景图和多通道CNN的三维模型视图提取方法,其特征在于,所述方法包括以下步骤:
将3D模型投影到满足预设条件的圆柱体的侧面上,以3D模型的原点为中心,将3D模型的轴线平行于X、Y、Z的主轴之一来获得初始全景图;
在任意两个坐标轴构成的平面中任取一角度分别以某一预设速率对三维空间中3D模型表面的角度和y坐标进行采样,获取初始全景图中的每个点的两组值,以此用来表示三维空间中3D模型表面的位置特征、以及3D模型表面的方向特征;构建多尺度网络与多通道卷积神经网络,将3D模型表面的位置特征、以及3D模型表面的方向特征作为输入,进行网络的训练和两种不同3D模型之间的相似性度量。
2.根据权利要求1所述的一种基于全景图和多通道CNN的三维模型视图提取方法,其特征在于,所述预设条件为:圆柱体的高度为底面半径的2倍。
3.根据权利要求1所述的一种基于全景图和多通道CNN的三维模型视图提取方法,其特征在于,所述预设速率为:以速率2B和B对角度和y坐标进行采样。
4.根据权利要求1所述的一种基于全景图和多通道CNN的三维模型视图提取方法,其特征在于,
所述多尺度网络包括:分别提取同一输入图片的不同分辨率的视图描述符,输入图片大小为256*256;
对于第一个尺度,大小为256*256,经过VGG16的卷积层得到特征映射,经过归一化处理得到4096维特征映射;
对于第二个尺度,将输入图片的尺度变换为128*128,进行下采样,经过卷积层得到低分辨率图片的特征映射,经过最大池化层、以及归一化处理得到3072维特征映射;
对于第三个尺度,将输入的图片的尺度变换为64*64,进行下采样,经过卷积层得到低分辨率图片的特征映射,经过最大池化层、以及归一化处理得到3072维特征映射;
将三个尺度的输出经过线性融合得到4096维特征图,然后经过全连接层得到视图描述符,再经过dropout,softmax层得到分类的结果向量;
最后,softmax层输出给定输入3D模型的类别概率,具有最高概率的类被认为是3D模型的预测类,使用动量设置为0.9的随机梯度下降法进行训练。
5.根据权利要求1所述的一种基于全景图和多通道CNN的三维模型视图提取方法,其特征在于,所述多通道卷积神经网络包括6个通道,
用于创建一个根据全景视图的3轴进行分割的分支通道,对于分类任务,通过取所有三个单独概率向量的均值计算概率向量;
每个3D模型有6个描述符,其中三个为XYZ轴上的空间分布描述符,用来描述3D模型表面的位置特征;
另外三个为XYZ轴上的法向量分布描述符,即3D模型表面的方向特征;
对这6个描述符使用L1距离度量,将每个3D模型描述符与剩余的3D模型描述符进行比较。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810879211.5/1.html,转载请声明来源钻瓜专利网。