[发明专利]一种语义结构一致的图像内容转换方法有效
申请号: | 202010979163.4 | 申请日: | 2020-09-17 |
公开(公告)号: | CN112149802B | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 尹梦晓;林振峰;覃子轩;杨锋 | 申请(专利权)人: | 广西大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06V10/80;G06V10/82 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 冯炳辉 |
地址: | 530004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语义 结构 一致 图像 内容 转换 方法 | ||
1.一种语义结构一致的图像内容转换方法,其特征在于,包括以下步骤:
1)收集训练数据,所述训练数据是指成对的图像,包括源图像和目标图像,源图像和目标图像一一对应,语义结构上保持一致;
2)对训练数据进行预处理,构建转换模型,包括编码器和生成器;
3)使用编码器下采样经过预处理的源图像,获取潜在编码;
4)使用生成器上采样潜在编码,上采样过程中通过动态感受野自适应融合多尺度信息,生成虚假的目标图像;其中,所述生成器包含上采样网络层、特征处理模块和输出层,所述生成器将编码器输出的潜在编码上采样,并在上采样过程中通过动态感受野自适应融合多尺度信息,处理方式为:
式中,表示编码器输出的潜在编码,表示生成器中第i层上采样网络层输出的特征,表示生成器中第i-1层上采样网络层输出的特征,表示编码器中第(n-i+1)层上采样网络层输出的特征,⊙表示沿张量的维度进行拼接,表示生成器中第i层上采样网络层使用的转置卷积,表示生成器中第i层上采样网络层使用的归一化方式,表示生成器中第i层上采样网络层使用的激活函数,i∈{1,2,3,...,n},n表示生成器中总的上采样网络层数,m表示编码器中总的下采样网络层数,dG表示生成器中的特征处理模块,表示编码器中输入层输出的特征,表示生成器中输出层使用的转置卷积,表示生成器中输出层使用的激活函数,IF表示虚假的目标图像;其中,dG对特征的处理方式为:
式中,表示生成器的上采样网络层中dG输入的特征,sd表示通过动态感受野自适应融合多尺度信息的模块,sd在dG中提取和融合多尺度信息,表示dG中第j次特征处理使用的归一化方式,表示dG中第j次特征处理使用的激活函数,表示dG中第j次特征处理使用的卷积,表示dG中第j次特征处理输出的特征,表示dG中第j-1次特征处理输出的特征,j∈{1,2},表示dG中的残差连接使用的激活函数,表示dG输出的特征;其中,sd通过动态感受野自适应融合多尺度信息的方式包含以下步骤:
4.1)使用不同感受野的卷积获取多尺度信息:
式中,表示sd输入的特征,表示sd中第k个卷积分支使用感受野大小为c的卷积,表示sd中第k个卷积分支使用的归一化方式,表示sd中第k个卷积分支使用的激活函数,表示sd中第k个卷积分支输出的特征,包含在感受野大小为c的卷积上获取的尺度信息,p表示sd中的卷积分支的数量,k∈{1,2,3,...,p},q表示sd中卷积分支中感受野的大小,c∈{1,3,5,...,q};
4.2)使用全局平均池化统计p个卷积分支输出特征的全局变化:
式中,GAP表示全局平均池化,表示sd中第p个卷积分支以感受野大小为q的卷积获取的特征,Ws表示全局变化的张量;
4.3)使用Ws计算自适应选择权重:
式中,ns表示对Ws进行降维使用的归一化方式,fs表示对Ws进行降维使用的激活函数,表示计算sd中第k个卷积分支的选择权重时使用的卷积,fw表示计算选择权重使用的激活函数,表示sd中第k个卷积分支的选择权重,表示不同尺度信息融合的特征,表示sd中第p个卷积分支的选择权重,通过控制中尺度信息的转换程度,使sd获得动态感受野;
5)构建判别器,使用虚假的目标图像,经过预处理的源图像和经过预处理的目标图像通过判别器构建损失函数;
6)通过训练使损失函数收敛获取参数最优的转换模型,使用参数最优的转换模型能够转换与训练数据中源图像同类的图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西大学,未经广西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010979163.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种冰箱生产用模具焊接装置
- 下一篇:密封元件、终端设备及密封元件的制作方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序