[发明专利]一种基于多重栈式自编码的深度特征表示方法在审
申请号: | 201710375648.0 | 申请日: | 2017-05-24 |
公开(公告)号: | CN107194438A | 公开(公告)日: | 2017-09-22 |
发明(设计)人: | 胡瑞敏;熊明福;陈军;沈厚明;梁超;陈金;徐东曙;郑淇 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06K9/66 | 分类号: | G06K9/66;G06N3/08 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙)42222 | 代理人: | 鲁力 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多重 编码 深度 特征 表示 方法 | ||
技术领域
本发明涉及一种深度特征表示方法,具体涉及一种基于多重栈式自编码的深度特征表示方法。
背景技术
在计算机视觉和多媒体应用中的一个关键性问题就是如何构造一个辨别力和鲁棒性都比较强的特征。在传统的视频分析及图像处理领域中已存在很多常用的底层视觉特征特征(诸如颜色、纹理、SIFT、HOG、LBP等),并且在一些视觉任务中也取得了较好的效果。当然,这些特征依然存在着一些限制:首先此类特征的提取过程都是人工设计,存在一定的算法复杂性,一般适用于较小型的数据集,然而当前所采用的视频图像几乎都是超十万级别的数据,因此,难以满足当前大数据中特征提取的需求。其次由于受到现实客观因素的影响,当前面临的数据类型复杂多变(灰度图、彩色图、光照、遮挡的视频数据等),传统的底层视觉特征不足以有效表达此类数据的特征信息。因此,设计新的算法提取视频图像中的辨别性特征以应对当前复杂多变的数据类型显得尤为必要。随着计算机视觉和机器学习算法的发展,深度学习技术(deep learning)作为一种新型的机器学习算法,其源于人工神经网络技术,从仿生学的原理模拟人脑对目标对象抽取层级特征的判别信息,其强大的信息判别能力得到了当前众多研究者的青睐。虽然这些算法在特征提取的采用分级处理的方法,也为复杂问题提供了有效的解决方案,但是对于特征提取过程的错综复杂的表示结果却很难直观地感受。除此之外,传统的深度体系结构只能提取单层的结构,这会导致失去一些有识别力的精准代表图片的信息。因此,本发明提出一种多重栈式自编码联合特征学习的技术,该方法通过多重自编码深度网络,从多个维度提取目标不同层级的特征信息,实现对目标的准确标准和判别。
发明内容
针对于对特征提取结果的复杂结果不能直观感受和深度体系结构只能提取单层结构的不足,本发明提出了一种可行的方法用于精确提取目标图片的特征,即试图模仿人类大脑的视觉皮质,结合图片表示的多层次特征来实现获取目标图片的特征。
为了实现上述目标,本发明采用的技术方案为一种基于多重栈式自编码的深度特征表示方法。
一种基于多重栈式自编码的深度特征表示方法,其特征在于,基于栈式自编码的基本原则。首先,说明一下,一个自编码需要一个输入x=Rd和第一个潜在表示的输入的映射h∈Rd′,用一个确定性的函数h=fθ=σ(Wx+b),参数θ={W,b}。然后利用这个方式通过反向映射重置输入:y=fθ′(h)=σ(W′h+b′),θ′={W′,b′}。两个参数通常以W′=WT的形式被限制,在编码输入和解码潜在表示yi时使用相同的权重。参数会通过训练集Dn={(x0,t0),...(xn,tn)}最小化一个适当的价值函数被最佳化,具体包括:
步骤1,建立多重多层次的自动编码,通过把不同层次的特征组合到一起实现由粗到精的过程。框架结合多个自编码器,它们每个都有不同的结构。拥有越少隐藏层的网络会得到目标低层次的信息,然后把这些特征组合到一起形成最终的表示,这样我们就可以得到由粗到精的目标特征表示。训练原始图片时,我们的框架会从不同的视角去获取它们的表示。通过这种方法,我们依靠新的推理体系确保每一层都会重置输入。这样得到的特征会更加的具有代表性和说服力。
步骤2,进行分层优化深度网络结构(栈式自编码网络结构)。
步骤3,对每个特征分配权重。为了得到一个更具鲁棒性的目标表示特征,对每个特征分配不同的权重。根据深度神经网络结构的特点,隐藏层层次越丰富对应的特征就越有判别力,因此我们对从更深层次的网络所提取的特征相应地设置更高的权重。这个进程通过下式表达:
其中F代表最终的综合特征,fi代表从i-th自编码器获得的特征,K代表深度自编码器的数量。
步骤4,进行分类。经过不同层次自动编码获得的不同特征会通过权重分配进行预处理。最后把经过处理的特征组合到一起形成最终的表示。之后,通过softmax分类器得到最终的分类结果。softmax分类器我们可以归纳为分类标签超过两个以上的分类问题,其是逻辑回归的一般形式。
在上述基于多重栈式自编码的深度特征表示方法,所述步骤2具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710375648.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种液体混合装置
- 下一篇:内置清污锥形转筒的浆料搅拌桶