[发明专利]一种基于语义属性视觉转换重构器的深度神经网络算法在审
| 申请号: | 202211133367.1 | 申请日: | 2022-09-17 | 
| 公开(公告)号: | CN115482449A | 公开(公告)日: | 2022-12-16 | 
| 发明(设计)人: | 周伯俊;顾菊平;杨慧;程天宇;蒋凌;赵佳皓;言淳恺 | 申请(专利权)人: | 南通大学 | 
| 主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/77;G06V10/764;G06N3/08;G06N3/04 | 
| 代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 王毅 | 
| 地址: | 226019 *** | 国省代码: | 江苏;32 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 语义 属性 视觉 转换 重构器 深度 神经网络 算法 | ||
1.一种基于语义属性视觉转换重构器的深度神经网络算法,其特征在于,包括如下步骤:
步骤1,构建语义属性模块B1,提取图像的语义属性特征矢量及关键部件的位置坐标;
步骤2,构建位置矢量模块B2,利用线性全连接层将关键部件的位置坐标转换为d维的位置特征矢量;
步骤3,构建L层的语义属性转换器B3,对语义属性特征矢量和位置特征矢量相加后的特征进行转换得到K个语义特征矢量,其中每层语义属性转换器由语义注意力计算模块和前馈全连接层组成;
步骤4,构建图像的语义目标重构器B4,将K个语义特征矢量表示为图的节点,计算节点两两之间的相似性系数,得到目标图像的重构矩阵P,计算该矩阵的C个特征向量并将其级联起来作为目标图像的重构向量;
步骤5,通过损失函数计算目标图像的重构向量与图像的真实标签的误差值,利用误差值反向训练优化网络参数,使该算法达到最优。
2.根据权利要求1所述的一种基于语义属性视觉转换重构器的深度神经网络算法,其特征在于,所述步骤1的具体步骤如下:
S11:收集若干关于语义属性的图像小块,使用这些图像小块内的像素值向量训练K类分类器C(·);
S12:对于任一幅图像被表示为I(x,y),其中(x,y)表示图像内任意像素点,分别计算该点在水平方向和垂直方向上的一阶梯度Ix和Iy,以及水平方向和垂直方向上的二阶梯度和建立梯度相关矩阵即:
S13:计算矩阵M的特征值以及迹,其中特征值被表示为λ1,λ2,矩阵的迹被表示为ρ,定义属性检测候选区域函数:
其中,t为可调参数;判断N与阈值T之间的关系,当N大于T时,则(x,y)视为语义属性候选区域点;
S14:以(x,y)为中心将半径为r的图像小块内的像素值转化为向量输入到训练好的分类器C(·)中输出K个语义属性类别的概率值,同时获取图像的K个关键部件;其中第k个关键部件的位置坐标表示为(xk,yk);
S15:以提取的关键部件位置坐标为中心将半径为r内每个通道的图像区域的像素值转换为d维的语义属性特征矢量,其中第k个关键部件的语义属性特征矢量表示为
3.根据权利要求1所述的一种基于语义属性视觉转换重构器的深度神经网络算法,其特征在于,所述步骤2的具体步骤如下:
S21:构建d维的线性全连接层Ψω(·);其中,w为全连层参数;
S22:利用线性全连接层将关键部件的位置坐标转换为d维的位置特征矢量,其中第k个关键部件的位置坐标转换后的d维位置特征矢量ψk,由ψk=Ψw(xk,yk)计算得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211133367.1/1.html,转载请声明来源钻瓜专利网。





