[发明专利]一种基于深度学习的纹身图像分类方法有效
| 申请号: | 201410138343.4 | 申请日: | 2014-04-08 |
| 公开(公告)号: | CN103996056B | 公开(公告)日: | 2017-05-24 |
| 发明(设计)人: | 张永良;肖健伟;高思斌;肖刚 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G06K9/66 | 分类号: | G06K9/66 |
| 代理公司: | 杭州斯可睿专利事务所有限公司33241 | 代理人: | 王利强 |
| 地址: | 310014 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 深度 学习 纹身 图像 分类 方法 | ||
技术领域
本发明涉及图像处理和模式识别等技术领域,尤其是一种纹身图像分类方法。
背景技术
纹身图像识别的研究刚刚兴起,没查阅到国内相关的论文和专利,在国外也只有A.K.Jain等几个学者在从事纹身相关的学术研究。尽管已有了一定的发展,但仍存在诸多迫切需要解决的问题。第一,现有感兴趣区检测方法存在一定的缺陷。现有纹身图像感兴趣区的检测,主要是通过人工标定或图像分割算法。图像分割算法是低层视觉特征对用户实际兴趣的一种估计,难以实现对感兴趣区的客观描述。因此,这两种方法都存在主观性问题。第二,人工语义标注难以适应日益变大的图像数据库。对大规模的图像数据库进行的人工语义标注需要耗费大量的人力和时间,而且人对图像的理解是非常主观的,不同的人依据自身的知识、经验、情绪和其他情况,可能对相同的图像做出不同的理解。第三,低质量图像匹配方法尚待完善。现有的纹身识别方法,大都通过提取关键点作为比对特征,当图像对比度小、亮度不均或者图像分辨率低的时候,提取得到的关键点数少;如果纹身图像被毛发遮挡,那么大部分的关键点会从毛发而不是从纹身中提取得到。由于纹身是刻在人体皮肤上的,因此纹身图像会随人体的运动而发生扭曲和变形。纹身识别系统的性能往往因为未能合理的计算低质量纹身图像间的相似度而明显下降。
深度学习是受大脑是一个深度网络结构的启发,对于深度结构的神经网络研究了10多年。但是在2006年前一直没有好的结果,只有2,3层的网络有比较好的结果,更加深层的网络甚至比浅层网络的表现还要差。在2006年可以看做是深度结构的神经网络的一种突破,Hinton和他的团队使用了一种深度置信网络(Deep Belief Networks:DBN)。这个训练方法是使用无监督的方法逐层贪婪地每次训练一层。使用的是RBM(Restricted Boltzmann Machine),之后相关的基于自编码机(Auto-Encoder:AE)被提出。显然是使用同一种方法:训练中间层时使用无监督的学习方法。这种方法可以用在中间层的每一层,其他的深度结构的算法(不是RBM和AE)也在最近被提出,但是都八九不离十。从2006年后深度网络成功运用于分类,回归问题、降维、纹理建模、运动建模、目标分割、信息提取、机器人领域、自然语言处理、协同过滤等,尽管AE,RBM,DBN可以被用于训练为标定的数据,在许多上述的运用案例当中,他们被成功来用初始化深度受监督的前向回馈神经网络。
神经网络在处理信息的时候使用分布式表达:信息不是存储在单一的几个神经元上的,而是分开存储在许多的神经元上,不仅信息是被分布式存储的,大脑处理信息也是稀疏的,同一时间只有约1~4%的神经元被激活。
在许多计算机视觉系统中,学习算法受限于处理链的一些特定的部分,剩下部分的设计非常耗时耗力,这也就是限制这些系统规模的很大原因。从另外一方面来说,终极目标的人工智能当然不只是为了识别某些特定的物体。我们需要一个完整的算法去解决一个非常多的任务和感知。这就使人为标定这些东西比较困难,所以在这种情况下学习无标定样本的无监督学习成为一个比较重要的事情。这成为多任务学习(multi-task learning)的一个重要部分,使用多层结构的学习算法很自然地提供了这种共享和重用的概念:低等级的视觉特征(比如边缘探测器)和中等级的视觉特征(比如人的一部分)对于探测一个人是非常有用的,同时也对于探测别的包含人在内的大量物体。深度学习算法基于中间层的表现可以在不同人物中共享他们的特征,从而他们可以利用无监督的数据和一些数据来自相似的任务来解决一些由于数据标定问题而导致不能学习的问题。
使用深度学习的分类器能带来如下好处:
1.分类器具有学习复杂的高度变化的函数的能力
2.具有学习超大样本量的能力
3.分类器的主要学习过程是通过无标定样本使用无监督学习获得的。
4.具有浅层特征共享的能力
5.有较强的无监督学习能力
自编码神经网络是一种无监督学习算法,它使用了反向传播算法,并让目标值等于输入值。自编码神经网络尝试学习一个hW,b(x)≈x的函数。换句话说,它尝试逼近一个恒等函数,从而使得输出接近于输入x。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410138343.4/2.html,转载请声明来源钻瓜专利网。





