[发明专利]基于因果流模型的可控汽车图像合成方法有效

专利信息
申请号: 202010942153.3 申请日: 2020-09-09
公开(公告)号: CN112102156B 公开(公告)日: 2023-06-09
发明(设计)人: 廖军;颜学文;刘礼 申请(专利权)人: 重庆大学
主分类号: G06T3/00 分类号: G06T3/00;G06V10/764;G06V10/82;G06N3/0464;G06N3/088
代理公司: 重庆缙云专利代理事务所(特殊普通合伙) 50237 代理人: 王翔
地址: 400044 *** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 因果 模型 可控 汽车 图像 合成 方法
【权利要求书】:

1.基于因果流模型的可控汽车图像合成方法,其特征在于,包括以下步骤:

(1)获取原始汽车图像数据,并写入汽车图像数据集D中;对汽车图像数据集D进行预处理,得到汽车图像数据集D′=[D1,D2,....,Dx];X为汽车图像样本总数;Dx表示汽车图像样本;

(2)基于汽车图像数据集D′,建立可逆流模型pθ(x);x=D1,D2,....,Dx;所述可逆流模型pθ(x)用于对汽车图像样本x进行非线性变换,将高维的汽车图像样本x映射到潜在空间,得到独立的潜在向量z;

(3)根据可逆流模型pθ(x),建立可逆流模型pθ(x)的网络架构;所述网络架构包括激活归一化层、可逆1×1卷积层和仿射耦合层;可逆流模型pθ(x)的网络架构分为前向流网络和逆向流网络;

(4)将汽车图像样本x输入到可逆流模型pθ(x)的前向流网络中,得到潜在变量z′;

(5)建立基于约束的因果网络;根据因果网络建立汽车图像数据集D′特征之间的因果关系,得到因果关系网络

(6)根据因果关系网络设置监督条件cs,并建立可控因果编码器Eθ

利用编码器Eθ在监督条件cs和无监督条件cu上构建潜在向量z的条件分布pθ(z);

利用条件分布pθ(z)生成多样化潜在向量z的汽车图像样本;

(7)建立监督模块,包括判别器D、分类器Cφ和解码器D;所述判别器D用于判别多样化潜在向量z的真实性;分类器Cφ用于对汽车图像类别进行分类;解码器D用于重构汽车图像自动学习到的无监督条件;

其中,判别器D、分类器Cφ和解码器D的损失利用L2正则化方法实现最小化;

(8)集成可逆流模型、监督模块和因果编码器,构建因果流模型,将潜在变量z′输入到因果流模型的逆向流网络中,输出可控的合成汽车图片y;

输出合成汽车图片y的步骤如下:

1)利用Squeeze函数增加汽车图像样本x的维数;汽车图像样本x原始维数为h×w×c;

2)激活归一化层对汽车图像样本x进行预处理,步骤如下:

2.1)把汽车图像样本x的通道c归一化为0平均值和单位方差的通道数据;

2.2)对汽车图像样本x和汽车图像y进行线性变换,即:

式中,⊙表示矩阵相乘;(i,j)表示张量x和y的空间索引;s和b分别表示通过卷积神经网络学习到的缩放变换参数和平移变换参数;

汽车图像样本x和汽车图像y的逆变换如下所示:

其中,汽车图像样本x和汽车图像y的雅可比矩阵对对数行列式为h*w*∑log|s|;

3)可逆1×1卷积层利用c×1权重矩阵对汽车图像样本x的通道c进行加权,叠加c个权重矩阵,混合可逆流模型通道,步骤如下:

3.1)建立汽车图像样本x和汽车图像y的变换关系式,即:

式中,W为c×c权重矩阵;

汽车图像样本x和汽车图像y逆变换如下所示:

3.2)计算权重矩阵W的对数行列式即:

3.3)对权重矩阵W进行LU分解,降低对数行列式计算的复杂度;分解后的权重矩阵W如下所示:

W=PL(U+diag(s″))    (6)

式中,P是计算后的通道排列矩阵;L为下三角矩阵;U为上三角矩阵,其对角线元素为0;s″为对角矩阵,对角元素为权重矩阵W上三角矩阵的对角元素;log|det(W)|=sum(log|s″|);

4)建立仿射耦合层,步骤如下:

4.1)运用函数split()沿着通道维度将输入的汽车图像张量x切分成两部分,分别记为汽车图像xa和汽车图像xb,即:

xa,xb=split(x)   (7)

4.2)利用神经网络(log s,t)=NN(xb)对汽车图像xa进行线性组合,得到汽车图像ya=s’⊙xa+t;其中,参数s′=exp(log s);函数NN()是非线性映射函数;参数s′和参数t不参与可逆变换;

4.3)对汽车图像xb进行恒等变换,得到汽车图像yb=xb

4.4)利用函数concat()将汽车图像ya和汽车图像yb连接成一个输出的汽车图像张量y,即:

y=concat(ya,yb)    (8)

其中,仿射耦合层的逆变换如公式:

ya,yb=split(y)    (9)

(log s,t)=NN(yb)    (10)

s′=exp(log s)    (11)

xa=(ya-t)/s′    (12)

xb=xb    (13)

x=concat(xa,xb)    (14)

4.5)利用公式(10)对汽车图像ya进行线性组合,求得对数行列式sum(log|S|),并根据对数行列式sum(log|S|)计算得到概率分布函数pθ(x)。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010942153.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top