[发明专利]一种基于图空洞卷积编码器解码器的3D姿态估计方法有效
申请号: | 202110658986.1 | 申请日: | 2021-06-15 |
公开(公告)号: | CN113255569B | 公开(公告)日: | 2021-10-01 |
发明(设计)人: | 沈复民;朱怡燃;徐行;申恒涛 | 申请(专利权)人: | 成都考拉悠然科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 谢建 |
地址: | 610041 四川省成都市中国(四川)自由贸易试验区成都*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 空洞 卷积 编码器 解码器 姿态 估计 方法 | ||
1.一种基于图空洞卷积编码器解码器的3D姿态估计方法,其特征在于,包括如下步骤:
步骤S1:选择训练数据集;
步骤S2:构建由图空洞卷积和图转换器组合堆叠形成的图空洞卷积编码器解码器模型;所述图空洞卷积编码器解码器模型包含三个部分:图空洞卷积、图转换器、编码器解码器的网络结构,其中,图空洞卷积由包含根节点、1-邻居、2-邻居以及3-邻居组成的并行卷积,是一种高级的多尺度图卷积,专注于扩大图卷积核的感受野和提取骨架中的多尺度上下文信息;图转化器主要是为了补充语义位置编码信息并捕捉全局长范围连接;图空洞卷积和图转换器组合并堆叠,然后使用图池化和上采样形成编码器解码器的网络结构;
步骤S3:对训练数据集进行预处理;
步骤S4:对图空洞卷积编码器解码器模型进行初始化操作;
步骤S5:利用步骤S3预处理后的训练数据集训练步骤S4的图空洞卷积编码器解码器模型,同时设置图空洞卷积编码器解码器模型的损失函数和学习率的更新方式;
步骤S6:用步骤S1选取的训练数据集验证步骤S5的图空洞卷积编码器解码器模型。
2.根据权利要求1所述的一种基于图空洞卷积编码器解码器的3D姿态估计方法,其特征在于:所述步骤S2中,图片特征经过图空洞卷积时,图片特征在图空洞卷积中经过多个并行卷积,从而获取图片中的多尺度上下文信息。
3.根据权利要求2所述的一种基于图空洞卷积编码器解码器的3D姿态估计方法,其特征在于:所述步骤S2中,图空洞卷积的计算公式如下:
其中,Ak是带有自环的k-邻居的邻接矩阵,表示第l层第k个并行卷积分支的输出,σ表示非线性激活函数,Wk表示一个可学习的用于节点特征表示学习的权重矩阵,X(l)表示第l层的输入特征,Mk表示一个可学习的权重矩阵。
4.根据权利要求1所述的一种基于图空洞卷积编码器解码器的3D姿态估计方法,其特征在于:所述步骤S2中,图片特征经过图转换器时,图片特征在图转换器中首先进行位置编码相加,然后得到的初步特征分别输入两个嵌入函数来获得高级别特征,以此来计算注意力矩阵。
5.根据权利要求4所述的一种基于图空洞卷积编码器解码器的3D姿态估计方法,其特征在于:所述步骤S2中利用图转换器得到全局注意力矩阵的公式如下:
其中,Wθ、用作嵌入函数的可学习权重矩阵,表示嵌入函数的可学习权重矩阵的转置,Matt表示经图转换器层得到全局的注意力矩阵,softmax()表示归一化函数,Xin表示输入特征矩阵,XinT表示输入特征矩阵的转置。
6.根据权利要求1所述的一种基于图空洞卷积编码器解码器的3D姿态估计方法,其特征在于:步骤S5中,图空洞卷积编码器解码器模型的损失函数设置为:
其中,表示预测的3D姿态与真实的3D姿态之间的损失,表示预测的3D姿态,J表示真实的3D姿态,i表示骨架中关节点的索引,k表示骨架中关节点的数量。
7.根据权利要求1所述的一种基于图空洞卷积编码器解码器的3D姿态估计方法,其特征在于:步骤S5中,学习率的更新方式设置为:
其中,base lr为初始学习率,iter为当前迭代次数,step为更新间隔步长,gamma设为0.96,lr表示为当前得到的学习率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都考拉悠然科技有限公司,未经成都考拉悠然科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110658986.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于追踪纹理复制效果的方法
- 下一篇:极片平直入料机构及入料方法