[发明专利]基于变分自编码机与对抗网络结合的零样本图像分类方法有效
申请号: | 201810574638.4 | 申请日: | 2018-06-06 |
公开(公告)号: | CN108875818B | 公开(公告)日: | 2020-08-18 |
发明(设计)人: | 侯兴松;高蕊 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/66;G06N3/06;G06N3/08 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 高博 |
地址: | 710049 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 编码 对抗 网络 结合 样本 图像 分类 方法 | ||
1.基于变分自编码机与对抗网络结合的零样本图像分类方法,其特征在于,由训练集中的样本的属性标签作为条件引导,在训练模型时将已知类别的样本和样本对应的属性标签作为模型的输入,通过重建损失,生成损失,判别损失,散度损失和分类损失对网络进行反向传播优化参数,模型训练完成后,输入采样的随机高斯噪声和未知类别的属性,生成对应的未知类别的伪样本,然后用伪样本训练分类器在未知类别样本上测试,实现零样本图像分类,包括以下步骤:
S1、用残差网络提取已知类别样本的特征Xs,维度d=2048,制作样本相应的属性标签和类别标签类别标签的第K+1列代表其他类,这里设为0;
S2、定义分类器网络Classifier,设置为一层全连接隐含层,神经元个数为n_hidden_C,输出为K+1维向量,利用已知类别样本Xs对分类器网络Classifier进行预训练,对分类网络参数进行初始化从而加速之后网络训练收敛的速度,优化网络参数的损失函数如下:
Lclassifier=-log(P(Yseen|Xs));
S3、定义条件变分自编码机CVAE的编码器网络Encoder为两层全连接隐含层,神经元个数为n_hidden_E,Encoder的输入为即Xs和Aseen进行向量拼接后输入;Encoder的输出为(2*dz)维的向量,前dz维设为Xs的均值μ(XS),后dz维设为Xs的方差∑(XS),均值和方差包含了Xs的结构信息;
S4、从随机高斯噪声中采样得到dz维的高斯噪声z~N(0,1),通过加均值乘方差得到zf=μ(Xs)+z*∑(Xs),同时从随机高斯噪声中采样得到dz维的高斯噪声zp~N(0,1);
S5、定义散度损失LKL;
S6、定义一个多层感知机网络作为条件变分自编码机的解码器,网络设置为一层全连接隐含层,神经元个数为n_hidden_G;
S7、选择交叉熵损失定义条件变分自编码机CVAE中的重建损失Lreconstruction;
S8、定义生成对抗网络中的判别器网络Discriminator,设置为一层全连接隐含层,神经元个数为n_hidden_D,将已知类别样本Xs,zf输入解码器的输出Xf和zp输入解码器的输出Xp作为判别器网络的输入;
S9、定义判别损失函数Ldiscriminator;
S10、将Xs,Xf和Xp作为分类器网络的输入,定义分类损失函数Lclassifier;
S11、定义生成损失函数,通过判别器的判定为真样本,通过分类器分类完成属于其引导属性对应的类别;
S12、整体训练网络,定义模型中每个模块的优化函数,训练模型时每个模块分别用各自对应的损失函数进行反向传播优化参数;
S13、测试时,输入为未知类别对应的属性Aunseen和随机采样的高斯噪声zt~N(0,1),将二者拼接作为解码器的输入,输出为生成的未知类别的伪样本Xu'。
2.根据权利要求1所述的基于变分自编码机与对抗网络结合的零样本图像分类方法,其特征在于,步骤S5中,散度损失LKL如下:
LKL=KL(qE(z|x,a)||Pz)
其中,qE(z|x,a)为zf,Pz~N(0,1),KL为两个分布的KL散度计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810574638.4/1.html,转载请声明来源钻瓜专利网。