[发明专利]一种基于主成分分析改进生成对抗网络的半监督分类方法在审
申请号: | 201910012548.0 | 申请日: | 2019-01-07 |
公开(公告)号: | CN109740677A | 公开(公告)日: | 2019-05-10 |
发明(设计)人: | 王春枝;吴盼;严灵毓;王毅超;蔡文成;周方禹 | 申请(专利权)人: | 湖北工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 杨采良 |
地址: | 430068 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 半监督 降维 对抗 主成分分析法 主成分分析 生成器 分类 随机噪声向量 分类准确率 网络 数据代替 数据维度 随机噪声 网络改进 网络生成 原始图片 原数据 准确率 迭代 向量 改进 压缩 保留 图片 | ||
本发明属于生成对抗网络改进领域,公开了一种基于主成分分析改进生成对抗网络的半监督分类方法,使用主成分分析法(PCA)对原始图片进行压缩降维,用降维得到的向量代替原始的随机噪声向量,作为生成器的输入,提高了生成对抗网络生成图片的质量,同时也提高了半监督分类的准确率。本发明主成分分析法可以在降低数据维度的同时保留原数据的部分特征,用降维后的数据代替随机噪声输入生成器,能够更快的生成质量更高(更接近真实图片)的数据,减少网络迭代次数,提高分类准确率。
技术领域
本发明属于生成对抗网络改进领域,尤其涉及一种基于主成分分析改进生成对抗网络的半监督分类方法及系统。
背景技术
生成式对抗网络(GAN,Generative Adversarial Networks)是一种深度学习模型,模型通过框架中(至少)两个模块:生成器(Generative Model)和判别器(Discriminative Model)的互相博弈学习产生相当好的输出。生成器是给定某种隐含信息,来随机产生观测数据。原始GAN理论中,并不要求生成器G和判别器D都是神经网络,只需要是能拟合相应生成和判别的函数即可。但实用中一般均使用深度神经网络作为G和D。生成对抗网络由生成器G和判别器D两部分组成,生成器部分使用的是随机噪声输入,导致训练过程中存在不稳定性,生成图片的质量较低,使用原生成对抗网络进行半监督分类的准确率不高。
一个优秀的GAN应用需要有良好的训练方法,否则可能由于神经网络模型的自由性而导致输出不理想。半监督分类(Semi-Supervised Classification)是在只有少量带标签数据的情况下,使用大量无类标签的样例帮助训模型,获得比只用有类标签的样本训练得到的分类器性能更优的分类器,弥补有类标签的样本不足的缺陷。未标记样本虽未直接包含标记信息,但若它们与有标记信息样本是从同样的数据源独立同分布采样而来,则它们所包含的关于数据分布的信息对建立模型是有帮助的。将GAN应用于半监督分类任务时,只需要对最初的GAN的结构做稍微改动,即把discriminator模型的输出层替换成softmax分类器。假设训练数据有K类,那么在训练GAN模型的时候,可以把generator模拟出来的样本归为第K+1类,而softmax分类器也增加一个输出神经元,用于表示discriminator模型的输入为“假数据”的概率,这里的“假数据”具体指generator生成的样本。因为该模型可以利用有标签的训练样本,也可以从无标签的生成数据中学习,所以称之为“半监督”分类。
PCA(principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据压缩算法。在PCA中,数据从原来的坐标系转换到新的坐标系,由数据本身决定。转换坐标系时,以方差最大的方向作为坐标轴方向,因为数据的最大方差给出了数据的最重要的信息。第一个新坐标轴选择的是原始数据中方差最大的方法,第二个新坐标轴选择的是与第一个新坐标轴正交且方差次大的方向。重复该过程,重复次数为原始数据的特征维数。主成分分析经常用于减少数据集的维数,同时保持数据集的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。
综上所述,现有技术存在的问题是:
(1)生成对抗网络中生成器的输入为随机噪声,随机性会导致生成器的参数不易训练,难以生成高质量的图片。
(2)现实生活中,有标签数据少无标签数据多是一个普遍现象,现有技术无法充分利用无标记样本来训练网络模型。
(3)生成器和判别器是一个相互博弈的过程,用生成对抗网络进行半监督分类是对判别器的输出稍作调整,改成一个分类器,生成器的效果会影响到判别器(分类器)最后的分类准确率。
解决上述技术问题的难度:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖北工业大学,未经湖北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910012548.0/2.html,转载请声明来源钻瓜专利网。