[发明专利]逐层逆化识别模型的生成模型训练方法有效
申请号: | 201911274553.5 | 申请日: | 2019-12-12 |
公开(公告)号: | CN111160415B | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 陈旋;吕成云;林善冬 | 申请(专利权)人: | 江苏艾佳家居用品有限公司 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/774;G06V10/764;G06N3/08;G06K9/62 |
代理公司: | 南京新慧恒诚知识产权代理有限公司 32424 | 代理人: | 邓唯 |
地址: | 211100 江苏省南京市江宁区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 逐层逆化 识别 模型 生成 训练 方法 | ||
本发明公开了一种逐层逆化识别模型的生成模型训练方法,以图像生成为例,通过逐层逆化现有的识别模型(如在VGG、Inception‑v3、ResNet等),从而稳定地训练生成对抗模型,使得其中的生成模型能够生成逼真的指定类别的图像。逐层逆化指:对识别模型从输出层到输入层,逐层地以输出层的输出加随机因子作为生成种子,以真实图像特征提取至本层的输入作为真实样本,以本层及其后的识别模型的各层直至输出层作为监督器,指导训练生成对抗模型。本发明的方法不仅适用于构建图像生成模型,声音、文字等其他数据的生成模型同样可用本发明方法进行构建。
技术领域
本发明涉及深度学习技术领域,尤其涉及一种逐层逆化识别模型的生成模型训练方法、计算机设备和存储介质。
背景技术
在深度学习领域,生成对抗模型以其能无监督的学习自然数据集而广受学术界乃至工业界追捧。但众所周知,生成对抗模型也是出奇地难以训练。训练不稳定,经常在训练过程中陷入模式爆炸的困境。另一方面,同样在深度学习领域,各类识别模型已经非常成熟。如何避开生成对抗模型的训练困境,能否利用现成的识别模型,进行监督辅助,具有重要意义。优良的训练过程所获得的相应模型可以应用在图片、视频、声音、文字等具体对象的生成上,提升图片、视频、声音、文字等具体对象的生成效果和生成效率。然而传统的逐层逆化识别模型的生成模型训练方式往往存在稳定性低的问题,容易影响所得模型的对象生成效果。
发明内容
针对以上问题,本发明提出一种逐层逆化识别模型的生成模型训练方法、计算机设备和存储介质。
为实现本发明的目的,提供一种逐层逆化识别模型的生成模型训练方法,包括如下步骤:
S10,将深度学习图像识别模型按层拆解,从深度学习图像识别模型的最后输出层到最初输入层按顺序选取选定层;
S20,将训练样本图片输入深度学习图像识别模型,获取深度学习图像识别模型中选定层的输入和最后输出层的输出;
S30,将最后输出层的输出和预设的随机种子拼接成生成种子,对选定层之后的各层进行逆化,得到选定层的生成模块,将生成种子输入生成模块,获取生成模块的输出;
S40,将生成模块的输出输入深度学习图像识别模型的后部分模型,得到生成识别结果,计算生成识别结果与最后输出层的输出的分类损失,得到生成模块第一损失函数;其中,所述后部分模型包括选定层之后的所有层组成的模型;
S50,获取生成模块获取过程中得到的对抗模块,将生成模块的输出输入到总对抗模块中,得到生成对抗输出,将选定层的输入输入到总对抗模型中,得到真实对抗输出;其中,总对抗模块包括对抗模块以及在此之前得到的对抗模块;
S60,根据生成对抗输出和第一损失函数计算生成模块的第二损失函数,根据第二损失函数更新生成模块参数,根据生成对抗输出和真实对抗输出,计算对抗模块的第三损失函数,根据第三损失函数更新对抗模块参数;
S70,重复执行步骤S20至步骤S60,直至对抗模块无法分辨生成模块的输出与训练样本图片的真实值区别为止;
S80,重复执行步骤S10至步骤S70,直至逆化深度学习图像识别模型的各层为止。
在一个实施例中,所述第一损失函数包括:
Lcls=-∑li×log(pi),
其中,li是类别one-hot编码的元素,pi是分类器输出的属于第i类的概率,Lcls表示第一损失函数。
作为一个实施例,所述pi的确定公式包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏艾佳家居用品有限公司,未经江苏艾佳家居用品有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911274553.5/2.html,转载请声明来源钻瓜专利网。