[发明专利]基于动态图卷积的三维模型形状识别方法在审
| 申请号: | 202110888504.1 | 申请日: | 2021-08-03 |
| 公开(公告)号: | CN113674337A | 公开(公告)日: | 2021-11-19 |
| 发明(设计)人: | 韩丽;佟宇宁;兰鹏燕 | 申请(专利权)人: | 辽宁师范大学 |
| 主分类号: | G06T7/593 | 分类号: | G06T7/593;G06T3/40;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 大连非凡专利事务所 21220 | 代理人: | 闪红霞 |
| 地址: | 116000 辽宁*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 动态 图卷 三维 模型 形状 识别 方法 | ||
1.一种基于动态图卷积的三维模型形状识别方法,其特征在于按照如下步骤进行:
步骤1.建立自适应动态图卷积神经网络ADCNN,包含1层可变形3D卷积层、4层卷积层、2层上采样层、3层全连接层,分别为3DConv、Conv1、Conv2、Conv3、Conv4、UC1、UC2、FC1、FC2、FC3,所有卷积核大小均为3×3像素;
所述3Dconv包含32个以Xavier方法进行初始化的卷积核,采用ReLU作为激活函数;Conv1包含64个以Xavier方法进行初始化的卷积核和64个神经元的池化层,采用ReLU作为激活函数;Conv2包含32个以Xavier方法进行初始化的卷积核和32个神经元的池化层,采用ReLU作为激活函数;Conv3包含64个以Xavier方法进行初始化的卷积核和64个神经元的池化层,采用ReLU作为激活函数;Conv4包含32个以Xavier方法进行初始化的卷积核和32个神经元的池化层,采用ReLU作为激活函数;UC1输出的特征向量的维度为128;UC2输出的特征向量的维度为64;FC1和FC2输出的特征向量的维度均为32;FC3利用1×1卷积输出1024维的特征向量;各层的排列顺序从前到后分别为3Dconv、FC1、Conv1、FC2、Conv2、Conv3、UC1、Conv4、UC2、FC3;
所述3Dconv层利用公式(1)定义的可变形三维卷积算子完成卷积运算,得到每个邻域点的3D偏移量(Δx,Δy,Δz);
其中,pi表示3D模型中的第i个位置,y(pi)表示可变形三维卷积算子在pi处产生的输出特征,pj表示以pi为中心的、3×3×3卷积采样网格中的第j个位置,Ni表示pi的邻域采样点集合,|Ni|表示Ni包含的采样点数量,Δpj表示pj的3D偏移量,w(pj)表示pj对于pi的可训练权重,x(pi+pj+Δpj)表示3D模型在位置pi+pj+Δpj上的采样特征函数值;
所述Conv1、Conv2、Conv3、Conv4层利用公式(2)定义的卷积算子完成卷积运算;
其中,yi表示卷积层输出的第i个特征向量,xi表示卷积层输入的第i个特征向量,xj表示卷积层输入的第j个特征向量,b表示可训练的偏置量,Wm表示第m个可训练的加权矩阵且1≤m≤M,M表示可训练的加权矩阵的总数,qm(xi,xj)表示xj对Wm的权重函数,其定义由公式(3)给出;
其中,和cm表示线性变换参数向量,上标T表示向量的转置运算;
步骤2.生成3D模型采样点的邻域矩阵U;
步骤2.1输入n个非刚性3D模型的每个采样点的位置坐标,组成3D模型集合D={M1,M2,…,Mi,…Mn},所述Mi表示第i个3D模型;
步骤2.2对于D中的每个3D模型,利用KNN网络选取邻域点,进而建立采样点的邻域矩阵U;
步骤3.从3D模型集合D中选取三分之一的数据作为训练数据集,三分之一的数据作为测试数据集,其余三分之一的数据作为验证数据集,进而采用交叉验证法计算最佳的邻域点数量;
步骤4.利用步骤2所得到的3D模型数据集,对自适应动态图卷积神经网络ADCNN进行训练,其中,batch_size设置为16,正则化参数设置为0.5,学习率设置为0.01,dropout率设为0.5;
步骤4.1输入训练数据集中每个3D模型的原始坐标信息、邻域点位置信息及其邻域矩阵U,并将每个模型的特征图像的分辨率统一调整为224×224像素,令迭代次数计数器iter←1;
步骤4.2对于每个3D模型,利用3Dconv层的可变形三维卷积算子计算每个邻域点的3D偏移量(Δx,Δy,Δz),并利用三次线性插值算法将每个邻域点的3D偏移量(Δx,Δy,Δz)转换为整数型的偏移量(Δxz,Δyz,Δzz),进而将每个邻域点的原始坐标与其偏移量(Δxz,Δyz,Δzz)相加,得到更新后的3D模型;
步骤4.3将训练数据集中每个更新后的3D模型输入ADCNN网络的后续各个层,从而为每个3D模型计算得到一个4096维的输出特征向量y;
步骤4.4将每个3D模型的特征向量y输入Softmax函数,得到ADCNN在训练集上的识别匹配结果及其预测损失loss;
步骤4.5令iter←iter+1,若iterTotalIter,则得到已训练好的自适应动态图卷积神经网络ADCNN,转入步骤5,否则,利用基于随机梯度下降法的反向误差传播算法和预测损失loss更新ADCNN的参数,转入步骤4.2重新处理训练集中的所有3D模型,所述TotalIter表示预设的迭代次数;
步骤5.利用训练好的自适应动态图卷积神经网络ADCNN对3D模型进行形状识别;
步骤5.1输入一个待处理的3D模型InputModel的原始坐标信息、邻域点位置信息及其邻域矩阵U,并将该模型的特征图像的分辨率统一调整为224×224像素;
步骤5.2将InputModel的原始坐标信息、邻域点位置信息、邻域矩阵U以及调整后的特征图像输入自适应动态图卷积神经网络ADCNN中,计算得到一个4096维的输出特征向量y;
步骤5.3将特征向量y输入Softmax函数,从而输出3D模型InputModel的识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁师范大学,未经辽宁师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110888504.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据重构方法、设备、存储介质及装置
- 下一篇:一种稳定型低噪音永磁电机





