[发明专利]一种一体化的条件图像重绘方法及装置在审

专利信息
申请号: 202210625609.2 申请日: 2022-06-02
公开(公告)号: CN114842105A 公开(公告)日: 2022-08-02
发明(设计)人: 施柏鑫;李思;孙冀蒙;翁书晨;常征 申请(专利权)人: 北京大学
主分类号: G06T11/00 分类号: G06T11/00;G06T11/60;G06N3/04;G06N3/08
代理公司: 北京挺立专利事务所(普通合伙) 11265 代理人: 高福勇
地址: 100871*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 一体化 条件 图像 方法 装置
【权利要求书】:

1.一种一体化的条件图像重绘方法,其特征在于,包括以下步骤:

S1、颜色条件xc首先被编码并且在几何条件xg的指导下进行广播,处理后的特征表示为egc,随后对处理后的特征egc进行卷积,得到隐层特征h作为生成网络FG的原始输入;生成网络FG由卷积层和FABN模块堆叠构成,FABN模块中还包含CMCFM模块进行模态融合;

S2、纹理条件z、几何条件xg和背景条件yb通过FABN模块在生成网络FG的中间注入,在FABN模块中,几何条件xg、背景条件yb和隐层特征h首先在CMCFM模块中进行融合,随后通过卷积生成两个可学习的外表参数βa和γa,同时,纹理条件z也生成两个可学习的模式参数βp和γp

S3、采用步骤S2生成的外表参数βa和γa以及模式参数βp和γp调制经过批归一化处理后的隐层特征h,经过多层修正,最后生成重绘图像。

2.根据权利要求1所述的一体化的条件图像重绘方法,其特征在于,步骤S1采用HCMSM模型实现;HCMSM模型包括两个编码器以及一个基于多粒度注意力的相似度损失函数,图像编码器含有n组的组卷积网络,m个不同的中间层捕捉m层的特征作为输出;文本编码器由m个编码器单元组成,并且用不同的语义层表示文本属性,通过元素级的累加,不同的单元被连接起来并组成一个多层结构。

3.根据权利要求2所述的一体化的条件图像重绘方法,其特征在于,步骤S1采用HCMSM模型实现的实现过程为:图像编码器首先将合成图像按照几何条件xg的指导分割成n个不同的类别区域,记做(y′0,y′1,...,y′0-1);随后将各部分类别区域分别注入到n组的组卷积网络(G0,G1,...,Gn)中,其中每个组卷积对应每个类别区域;通过提取m个中间层特征来挖掘不同粒度的语义信息,表示为其中i∈{0,...,m-1},j∈{0,...,n-1},Q为特征维度,H为图像高度,W为图像宽度;每个编码单元对颜色条件xc进行单独编码,记为其中i∈{0,...,m-1};颜色属性与图像类别区域的相关性矩阵为:Nc为文本属性的数量,Ng为重绘区域中切分的部分数目;将编码后的属性映射到相应的图像类别区域中,得到最终通过加法得到第(i+1)层的特征

4.根据权利要求2所述的一体化的条件图像重绘方法,其特征在于,多粒度基于注意力的相似度损失函数为:

其中,Ei,t为第t个样本中第i层的颜色特征,Yi,t为第t个样本中第i层的图像特征,P(Ei,t|Yi,t)为Ei,t和Yi,t匹配的后验概率,m为文本编码单元个数,T为一个批次中的样本总数。

5.根据权利要求1所述的一体化的条件图像重绘方法,其特征在于,步骤S2的FABN模块中,几何条件xg被卷积并且作为一种门控来混合重绘隐层特征h和背景条件yb

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210625609.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top