[发明专利]一种基于卷积神经网络的图像分类方法和装置有效
申请号: | 201310477564.X | 申请日: | 2013-10-12 |
公开(公告)号: | CN103544506B | 公开(公告)日: | 2017-08-08 |
发明(设计)人: | 周龙沙;邵诗强 | 申请(专利权)人: | TCL集团股份有限公司 |
主分类号: | G06K9/66 | 分类号: | G06K9/66;G06N3/02 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙)44268 | 代理人: | 王永文,刘文求 |
地址: | 516001 广东省惠州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 卷积 神经网络 图像 分类 方法 装置 | ||
技术领域
本发明涉及图像分类方法技术领域,尤其涉及的是一种基于卷积神经网络的图像分类方法和装置。
背景技术
现有的图像分类方法,常用的分类方法有监督学习方法譬如神经网络和支持向量机等、非监督学习方法譬如K均值聚类和近邻法等。传统神经网络属于监督学习方法,是通过对已有样本学习的基础上获取到所学对象的神经网络权值特征描述,并根据所学到的知识对外界环境中已学习的库的类别进行区分判断,但由于所学习的对象特征知识的有限性,对于外界变化环境中的测试对象,有可能会超出原来已有的学习知识范围,使得对所学对象在新的复杂环境下的识别分类效果不好。
进一步地,由于现有方式采用的非对称映射矩阵,该矩阵的维数决定了基于该结构的卷积神经网络所能进行分类的数量,当在对于较多图像类别进行分类的过程中往往会造成神经网络本身因为数据过多、对所学的某些类别无法进行学习和识别,导致出现神经网络学习过程中常见的“over fitting”问题,即过学习问题。
因此,现有技术还有待于改进和发展。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种基于卷积神经网络的图像分类方法和装置,旨在解决现有的神经网络图像分类方法分类效果不好、容易产生过学习现象的问题。
本发明解决技术问题所采用的技术方案如下:
一种基于卷积神经网络的图像分类方法,其中,包括以下步骤:
A、接收输入的多个类别的图像样本,对输入的每一个类别的图像样本数据进行归一化,将归一化后的图像样本数据进行卷积,再采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射,并将映射后的图像样本数据进行排列得到对应的一维特征描述,根据所述一维特征描述计算出每一个类别的图像对应的神经网络权值;
B、采用分层结构对多个类别图像的对应神经网络权值进行分布,且每一层分布的类别数目为根据所述非对称映射矩阵确定的最大区分类别数目,将多个类别图像在多层中依次分布,每一层形成对应的学习库;
C、对输入的测试类别图像样本数据进行处理得到对应的一维特征描述,将所述测试类别图像样本数据对应的一维特征描述与所述学习库中的神经网络权值进行前馈学习,从而判断出所述测试类别是否在所学习的类别图像中。
所述的基于卷积神经网络的图像分类方法,其中,所述步骤A具体包括:
A1、接收输入的多个类别的图像样本,将输入的每一个类别的图像样本数据进行归一化;
A2、对归一化的图像样本数据进行卷积,得到相应的多个卷积结果;
A3、对多个卷积结果进行一半的降采样;
A4、对降采样后的卷积结果进行再次卷积,并采用预定的非对称映射矩阵对卷积后的图像样本数据进行映射;
A5、对映射后的图像样本数据进行一半的降采样,并对降采样的结果进行排列得到该图像的一维特征描述;
A6、对所述一维特征描述进行预订的降采样得到缩减后的特征向量;
A7、将所述特征向量输入神经网络,进入神经网络的学习过程,进行前馈学习和BP反馈方式调节,得到相应的神经网络权值。
所述的基于卷积神经网络的图像分类方法,其中,所述步骤B具体包括:
B1、对N个类别的图像样本,根据所述非对称映射矩阵确定的最大区分类别数目M;
B2、建立NUM层学习类别,NUM为(N/(M-1))且为(N/(M-1))取向上的整数;
B3、对于每一层,采用最大区分类别数目M个类别来构建,依次在NUM层中来完成N个类别的分布;
B4、通过卷积神经网络来对每一层进行学习并形成每一层所对应的学习库。
所述的基于卷积神经网络的图像分类方法,其中,所述步骤B还包括:
B5、当有新的类别加入时,放入最后一组分层中并对该层重新进行学习形成新的学习库。
所述的基于卷积神经网络的图像分类方法,其中,所述步骤C具体包括:
C1、对输入的测试类别图像样本数据进行处理得到对应的一维特征描述;
C2、进入第i层,其中i=1,2,3……NUM,i初始化为1,即将测试类别图像样本数据对应的一维特征描述与所述第i层对应的学习库中的神经网络权值进行前馈学习,若能区分出类别出来则给出结果,并退出该层;若不能分类,则认为所述测试类别是该层中未学习的类别;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于TCL集团股份有限公司,未经TCL集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310477564.X/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序