[发明专利]基于零样本学习的细粒度图像识别方法有效
申请号: | 201710470805.6 | 申请日: | 2017-06-20 |
公开(公告)号: | CN107480688B | 公开(公告)日: | 2020-06-19 |
发明(设计)人: | 魏杰;武继刚;孟敏;王勇 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 广东广信君达律师事务所 44329 | 代理人: | 杨晓松 |
地址: | 510062 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 样本 学习 细粒度 图像 识别 方法 | ||
本发明公开了一种基于零样本学习的图像识别方法,包括:给定测试的图像集trainX和语义集trainY;初始化降维矩阵B和D,使得trainX=B*Zx、trainY=D*Zy,其中B,D是根据字典学习得到的初始结果,通过奇异值分解将特征矩阵分解为一个方阵,并选择前若干维作为字典B和D的初始化,Zx和Zy分别为降维后的低维空间中的图像特征和语义信息;初始化映射关系矩阵W;通过线性回归,使用随机梯度下降法调整W矩阵使得Zx=W*Zy;计算测试集的分类正确精度;根据分类结果差值来改进降维矩阵B和D,然后重复前述步骤,直至精度等于或高于目标精度后,输出结果。
技术领域
本发明涉及图像识别领域,具体涉及一种基于零样本学习的细粒度图像识别方法。
背景技术
随着各种电子设备在各个领域的普及,图像识别技术在人们的生活中已经变得无处不在,为了在越来越多的场景利用这一技术,对其识别的精准度也要求越来越高。然而,随着近几年大数据和大规模数据量学习的兴起,传统的图像识别技术逐渐无法满足新的图像识别需求,例如需要识别之前从未见过的类型的图像,这个问题在当前的海量数据中尤为突出,因此在大规模学习的背景下提高不可见类的识别精度具有重要的意义。为了提高在未见过类型的识别率,人们提出了双线性模型,通过非图像的辅助信息资源建立从可见类到不可见类的联系。在训练过程中,将图像的类别标签替换为具有语义信息的嵌入向量,并将图像特征和语义特征映射到同一低维潜层空间,通过支持向量机分类器来完成图像的分类工作。这种方法减少了训练好的分类器对原数据的过度依赖,实现了分类器的泛化性,完成了知识的迁移过程,最终提高了传统算法的识别精度。
然而对这类问题,现有的识别技术只简单的考虑到了不可见类的识别方法问题,并没有考虑到需要识别的图像样本的自身的特点属性。在现实环境中,通常会遇到细粒度的训练样本,即每个类别之间的相关性很高,在视觉上也有极高的相似性,通过神经网络提取出图像的特征后,如果直接使用支持向量机直接将样本进行分类,由于样本特征在高维空间中高度重合,无法用之前的方法得到一个大间距分类器将样本很好的分类,最终导致大量的图像数据被分类器视为噪点并错误分类,严重影响对不可见类的图片的识别精度。因此选择合适的方法对数据进行预处理和合适的分类器对于提升不可见类的识别精度至关重要。
发明内容
为了在大规模数据环境中提升细粒度图像识别的精度,尤其是识别之前从未见过类别的图像中的物体,如何在较快的时间内识别并提高细粒度识别的精度引起了广泛的关注。本发明的目的在于克服现有技术的缺点与不足,提供一种针对在zero-shot环境下的细粒度图像识别的精度不高的问题。本发明提供一种有效的泛化能力强的图像识别方法,在部分数据类别不可见的情况下,提高在细粒度图像数据的识别精度。
本发明出于分类的有效性考虑可采用如下方式进行设计。首先,将图像和语义信息从实体中提出特征,得到了图像和语义信息在特征空间的表达,对两个特征空间分别进行字典学习映射到低维子空间,然后,通过线性回归的方式,学习得到图像和语义信息在低维子空间的映射关系的矩阵,将计算所得的误差反馈给字典学习过程,用来改进特征空间到低维子空间的映射关系,从而尽量减少映射到低维子空间这一过程中所损失的特征表达,使得低维空间能更好的表达高维空间的信息。
一种基于零样本学习的图像识别方法,其步骤包括:
S1、给定测试的图像集trainX和语义集trainY;
S2、初始化降维矩阵B和D,使得trainX=B*Zx、trainY=D*Zy,其中所述步骤S2中的初始化降维矩阵B,D是根据字典学习得到的初始结果,通过奇异值分解将特征矩阵分解为一个方阵,并选择前若干维作为字典B和D的初始化,Zx和Zy分别为降维后的低维空间中的图像特征和语义信息;
S3、初始化映射关系矩阵W;
S4、通过线性回归,使用随机梯度下降法调整W矩阵使得Zx=W*Zy;
S5、计算测试集的分类正确精度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710470805.6/2.html,转载请声明来源钻瓜专利网。