[发明专利]一种将在线课堂中的图像和视频卡通化的方法在审
| 申请号: | 202011013600.3 | 申请日: | 2020-09-24 |
| 公开(公告)号: | CN112132922A | 公开(公告)日: | 2020-12-25 |
| 发明(设计)人: | 冷雨;赵耀;张竞佳;刘子何 | 申请(专利权)人: | 扬州大学 |
| 主分类号: | G06T11/00 | 分类号: | G06T11/00;G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06F16/951 |
| 代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 董旭东;赵荔 |
| 地址: | 225000 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 在线 课堂 中的 图像 视频卡 通化 方法 | ||
1.一种将在线课堂中的图像和视频卡通化的方法,其特征在于,包括以下步骤,
(1)从网上爬取若干真实图像和若干卡通图像作为训练数据集;
(2)构建生成对抗网络,将训练好的网络区别提取图像的高级特征的内容,设计损失函数来调整每个组件的权重;设计三个分别独立的图像处理模块,用来提取相应的三种卡通表示,并指导基于生成对抗网络的图像卡通化框架,平衡生成对抗网络中每个表示的权重,调整损失函数,获得卡通图像输出的最优样式;
(3)对于在线课堂中的输入图像自主选择卡通化模式;
(4)在训练完成后的生成对抗网络的生成器中,输入将要处理的在线课堂图像,输出相对应的卡通图;
其中,卡通化模式包括人像卡通化和整体卡通化, 对抗网络由一个生成器G和两个鉴别器Dx、Dy组成。
2.根据权利要求1所述的一种将在线课堂中的图像和视频卡通化的方法,其特征在于,所述步骤(1)中,三个独立的图像处理模块的三种卡通表示分别是,卡通图像通过平滑的轮廓表面表示、不同稀疏色块的结构表示、反映高频率纹理和细节的纹理表示。
3.根据权利要求2所述的一种将在线课堂中的图像和视频卡通化的方法,其特征在于,所述步骤(2)具体为,将步骤(1)所述真实图像I作为引导图,输入生成器G转化成卡通图象,I1表示输入图片,I11表示参考卡通图像,图像处理模块指导优化生成对抗网络图像卡通化的框架,包括以下步骤,
(201)图像处理模块Fd为了平滑图像,同时保持全局语义结构,边缘检测采用可区分的引导滤波器保留过滤,输出只提取保留颜色组成和表面特征的卡通图象;鉴别器Dx判断模型是否输出,并且是否和参考卡通图像具有相似的表面,并引导生成器G学习存储在提取的表面表示中的信息,表面损失函数设计为:
Lsur(G,Dx)=log (Dx(Fd(I11,I11)))+log(1-Dx(Fd(G(I1),G(I1)))) (1);
(202)图像处理模块Fs根据输入的图像,提取一个不可分割图,在每个分割区域使用标准超像素算法用像素值的平均值着色生成结构表示;用预先训练的VGGn网络来实施空间约束,结构损失函数设计为:
Lstr=||VGGn(G(I1))-VGG(Fs(G(I1)))|| (2);
(203)图像处理模块Ft减少颜色和亮度的影响并保留高频特征,然后让网络自主学习纹理细节,在学习纹理特征时,RGB三个颜色通道利用单通道纹理算法分开分析处理,RGB图转化的灰度图表示为U,Ft公式为:
Ft(Irgb)=(1-α)(β1*Ir+β2*Ig+β3*Ib)+α*U (3);
所述公式(3)中,设α在0~1之间取值,β1 、β2、β3在-1~1之间取值;
鉴别器Dy鉴别输出图像和参考卡通图像提取的纹理表示,并引导生成器G学习存储在纹理表示中的清晰图像和精细纹理,纹理损失函数设计为:
Ltex(G,Dy)=log (Dy(Ft(I11)))+log(1-Dy(Ft(G(I1))))(4);
(204)通过调整λ1、λ2、λ3、λ4以获得损失函数最优化,总得损失函数设计为:
L=λ1*Lsur+λ2*Lstr+λ3*Ltex+λ4*Ltv(5);
所述公式(5)中,为了减少高频噪声,设计损失函数Ltv,图像的空间维度用H、W、C代表,公式为:
Ltv=1/(H*W*C)* ||(▽x(G(I1))+▽y(G(I1)))|| (6);
其中,Ft(Irgb)为提取颜色图像,去除亮度和颜色信息;Fd为表面表示提取,Fs为结构表示提取,Ft为纹理表示提取,G(I1))为图像I1通过生成器G生成的卡通图像,VGGn(G(I1))为对G(I1)实施空间约束;Fs(G(I1)为提取G(I1)的结构表示, VGG(Fs(G(I1))为对Fs(G(I1))实施空间约束;Fd(I11,I11)为输入图像I11,返回被移除纹理和细节的表面表示;Fd(G(I1)为提取G(I1)的表面表示,Fd(G(I1),G(I1))为输入图像G(I1),返回被移除纹理和细节的表面表示;Ir、Ig和Ib为三个颜色通道,Ft(I11)为提取I11颜色图像,去除亮度和颜色信息,Ft(G(I1))为提取G(I1)颜色图像,去除亮度和颜色信息,λ1为表面损失函数的参数,λ2为结构损失函数的参数,λ3为纹理损失函数的参数,λ4为噪声损失函数的参数,α为, Dy(Ft(I11))为判定特征Ft(I11)来自训练样本I11 的概率,Dy(Ft(G(I1)))为判定特征Ft(G(I1))来自训练样本I1的概率,▽x(G(I1))、▽y(G(I1))使用梯度下降算法对G(I1)进行平滑处理且降低图像失真度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州大学,未经扬州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011013600.3/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





