[发明专利]一种基于注意力机制和流模型的图像生成方法在审
| 申请号: | 202110993967.4 | 申请日: | 2021-08-27 |
| 公开(公告)号: | CN113706650A | 公开(公告)日: | 2021-11-26 |
| 发明(设计)人: | 任俞睿;吴玉博;龙仕强 | 申请(专利权)人: | 深圳龙岗智能视听研究院 |
| 主分类号: | G06T11/00 | 分类号: | G06T11/00;G06N3/02;G06N3/08 |
| 代理公司: | 北京京万通知识产权代理有限公司 11440 | 代理人: | 万学堂;王跃交 |
| 地址: | 518116 广东省深圳市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 注意力 机制 模型 图像 生成 方法 | ||
1.一种基于注意力机制和流模型的图像生成方法,其特征在于,包括以下步骤:
S1.训练数据预处理;
S2.将预处理后的训练数据进入子任务一,使用注意力机制提取相关矩阵,用于生成有准确结构信息的中间结果;
S3.训练数据进入子任务二,使用流模型预测流场,用于生成具有丰富细节信息的中间结果;
S4.将子任务一生成的相关矩阵与子任务二生成的流场在不同尺度下一一对应地输入到子任务三中,使用内容感知网络生成权重图;以及
S5.子任务一、子任务二、子任务三的生成结果和训练数据进入主任务,使用编码器-解码器的网络生成人体图像,输出图像。
2.根据权利要求1所述的基于注意力机制和流模型的图像生成方法,其特征在于,在步骤S1中,输入图像,进行数据预处理,将所述训练数据处理为模型需要的大小和格式,生成原图像和目标图像的姿态图。
3.根据权利要求1所述的基于注意力机制和流模型的图像生成方法,其特征在于,在步骤S2中,将所述原图像和所述目标图像的姿态图输入到子任务一中,使用基于注意力机制的相关矩阵提取器提取不同尺度下所述原图像和所述目标图像的姿态图之间的相关矩阵,以平均绝对误差作为损失函数,生成有准确结构信息的中间结果。
4.根据权利要求1所述的基于注意力机制和流模型的图像生成方法,其特征在于,在步骤S3中,将原图像、原图像的姿态图和目标图像的姿态图输入到子任务二中,使用流模型预测器预测不同尺度下从原图像到目标图像的姿态图的流场,以采样正确性损失和正则化损失作为损失函数,用于生成具有丰富细节信息的中间结果。
5.根据权利要求1所述的基于注意力机制和流模型的图像生成方法,其特征在于,在步骤S4中,步骤S2和步骤S3中所提取的相关矩阵与流场是多尺度的,并且在不同尺度下一一对应地作为所述子任务三的输入。
6.根据权利要求1所述的基于注意力机制和流模型的图像生成方法,其特征在于,在步骤S5中,将所述原图像和所述目标图像的姿态图以及所述子任务一、所述子任务二和所述子任务三的生成结果输入到所述主任务中,生成人体图像。
7.根据权利要求1所述的基于注意力机制和流模型的图像生成方法,其特征在于,在步骤S5中,使用所述相关矩阵和所述流场对特征图进行扭曲,之后使用所述权重图对扭曲后的特征图进行逐元素相乘,再将两结果进行逐元素相加;之后将扭曲后的特征图输入到解码器中,为目标姿态特征添加真实的纹理信息,生成具有准确结构信息和丰富纹理细节的人体图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳龙岗智能视听研究院,未经深圳龙岗智能视听研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110993967.4/1.html,转载请声明来源钻瓜专利网。





