[发明专利]基于少量样本生成的任意风格和内容的迁移方法和系统有效
申请号: | 201710957685.2 | 申请日: | 2017-10-13 |
公开(公告)号: | CN107767328B | 公开(公告)日: | 2021-12-17 |
发明(设计)人: | 张娅;张烨珣;蔡文彬;王延峰 | 申请(专利权)人: | 上海媒智科技有限公司 |
主分类号: | G06T3/00 | 分类号: | G06T3/00;G06N3/04;G06N3/08 |
代理公司: | 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 | 代理人: | 徐红银 |
地址: | 200030 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 少量 样本 生成 任意 风格 内容 迁移 方法 系统 | ||
1.一种基于少量样本生成的任意风格和内容的迁移方法,其特征在于包括:
风格特征提取步骤:对风格参考图像,使用第一深度卷积神经网络提取图像的风格特征;
内容特征提取步骤:对内容参考图像,使用第二深度卷积神经网络提取图像的内容特征;
风格和内容特征结合步骤:对所述风格特征提取步骤得到的风格特征和所述内容特征提取步骤得到的内容特征通过双线性模型相结合,得到目标图像的特征;
目标图像生成步骤:对所述风格和内容特征结合步骤得到的目标图像的特征进行反卷积生成目标图像;
所述风格和内容特征结合步骤,其中:所述双线性模型是一种两因素模型,它具有的数学属性是固定其中一个因素,模型的输出对另一个因素来说是线性的,它能够灵活地将两个因素分离或者结合起来;
所述通过双线性模型相结合,公式如下:
Fij=SiWCj
其中,Si代表风格特征,是一个R维的向量,Cj代表内容特征,是一个B维的向量,W是一个R×K×B维的张量,Fij是目标图像的特征,是一个K维的向量,代表风格为Si内容为Cj的图像的特征;结合时,由风格参考集得到的风格特征和由内容参考集得到的内容特征按照此公式进行结合得到目标图像的特征;
所述风格特征提取步骤,其中:利用第一深度卷积神经网络模型,将风格参考集里的少量风格参考图像在图像通道维度上结合起来,一起输入风格特征提取步骤,学习参考图像中共同的部分,即图像的风格,得到风格特征;所述风格参考集是同种风格不同内容的图像,风格参考集给风格特征提取步骤提供要生成的风格的信息;
所述内容特征提取步骤,其中:利用第二深度卷积神经网络模型,将内容参考集里的少量内容参考图像在图像通道维度上结合起来,一起输入内容特征提取步骤,学习参考图像中共同的部分,即图像的内容,得到内容特征;所述内容参考集是同一内容不同风格的图像,内容参考集给内容特征提取步骤提供要生成的内容的信息;
所述目标图像生成步骤,其中:将风格和内容特征结合步骤得到的目标图像的特征输入反卷积神经网络,生成目标图像,生成的目标图像与真实的目标图像通过损失函数进行比较;所述目标图像生成步骤,具体如下:
在训练阶段,在每次迭代中,首先定义训练的目标图像集Dt,即想要生成的目标图像集合;为了给每个目标图像Iij∈Dt提供参考图像,以确定所要生成的目标风格Si和目标内容Cj,从训练集中为每个目标图像随机选取k张风格参考图像组成风格参考集Rsi,随机选取k张内容参考图像组成内容参考集Rcj,然后以风格参考图像,内容参考图像,目标图像三元组的形式进行训练,其中风格参考图像和内容参考图像分别输入风格特征提取步骤和内容特征提取步骤得到风格特征和内容特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海媒智科技有限公司,未经上海媒智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710957685.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种清咽片
- 下一篇:一种治疗宫外孕的中药丸