[发明专利]一种遥感场景分类方法在审
申请号: | 201710147637.7 | 申请日: | 2017-03-13 |
公开(公告)号: | CN106991382A | 公开(公告)日: | 2017-07-28 |
发明(设计)人: | 刘青山;杭仁龙;葛玲玲;宋慧慧;孙玉宝 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/08;G06T3/40 |
代理公司: | 江苏爱信律师事务所32241 | 代理人: | 唐小红 |
地址: | 210044 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 遥感 场景 分类 方法 | ||
技术领域
本发明属于图像信息处理技术领域,涉及一种遥感场景分类方法。
背景技术
随着遥感技术的发展,从卫星和飞机上获取大量的高分辨率地球观测图像。与其他图像不同的是,遥感场景表现出一些特殊的特征。例如,在一个场景中有各种不同大小、颜色和方向。在土地资源管理和城市规划等各种应用中,遥感场景分类是一项基础性工作,更是一个重要的研究课题。自动准确地解释如此庞大的图像库的已成为一个迫切的需求。
在过去的几年中,大量的特征表示模型已经提出了运用于场景分类。最常用的模型之一是视觉词袋,一般包括以下三个步骤:1)提取图像的底层视觉特征,如尺度不变特征变换(SIFT)和方向梯度直方图(HOG)的描述;2)通过使用k-均值或其他方法聚类特征形成视觉词汇;3)视觉特征映射到最接近的单词,通过单词直方图产生一个中级的特征表示。该模型及其变种在遥感领域已被广泛研究。
尽管视觉词袋在遥感场景分类是有一定的有效性,但是它提供了一个无序的局部描述符集合且没有考虑空间信息。为了克服这一缺点,空间金字塔匹配模型应运而生。该模型首先将原始图像分割成不同级别的分辨率。其次,对于每个级别的分辨率,从每个空间中提取局部特征的直方图。最后,空间直方图由加权金字塔匹配内核表示。由于遥感影像通常不存在绝对参照系,所以图像要素的相对空间排列变得十分重要。因此,提出了用空间金字塔共生模型表征图像的光度和几何信息。不同于将图像分割成统一的细胞,空间金字塔共生模型是用随机空间分割来描述各种图像布局的。
所有上述方法都是基于手工提取特征的,这很大程度上依赖于专家的经验和领域知识。此外,这些特征很难在鉴别力和鲁棒性之间取得最佳平衡。这主要是由于没有考虑真实数据的细节。深度学习算法,尤其是卷积神经网络,在解决这个问题上已经显示出巨大的潜力,因为可以从原始图像层次化的方式中自动学习高层次的语义特征,这在遥感社区已引起越来越多的关注。
然而,很难直接在遥感场景图像分类上运用卷积神经网络,因为往往要训练数以百万计的参数,而可用的训练集数量却很少。许多相关研究表明,从卷积神经网络中提取的特征是可以作为通用描述符。因此,从大规模的标注数据如ImageNet,运用神经网络学习出的图像表示,可以有效地被转移到一个带有限数量训练数据的广泛视觉识别任务中。出于这种想法,相关研究验证了使用ImageNet预训练的卷积神经网络进行遥感场景分类的可行性。采用预训练的卷积神经网络并微调遥感场景数据,分类性能令人印象深刻。目前,已有对于从卷积神经网络全连接层提取特征的泛化能力在遥感场景分类上的评估,并显示在公共遥感场景数据集上的最新结果。
虽然迁移学习能够缓解过度拟合的问题,但在基于卷积神经网络的遥感场景分类上还存在一些问题。第一,大部分的卷积神经网络只利用最后的全连接层作为后续的分类特征。直接丢弃前面卷积层的特征这是不合理的,因为这些可能是对分类目标有益的。事实上,从卷积层提取的特征比那些从连接层提取的特征更通用,因此这些特征可能更适合于迁移学习。此外,和激活全连接层相比,从卷积层提取的特征包含更多的空间信息,有利于图像分类。最近已有人认识到卷积层的特征的重要性,但他们只使用最后一个卷积层,忽略其他卷积层。
还有一个值得注意的问题,感兴趣的对象通常在不同的遥感场景有不同的尺度,甚至一个场景可能包含不同大小的对象。然而,最流行的卷积神经网络需要一个固定大小的输入图像(例如,227×227像素)。常见的解决方案是将原始遥感图像变形或固定成预先定义的大小,这不可避免地会导致有效的判别信息的丢失。
受空间金字塔模型启发,我们考虑所有卷积层的特征作为输入图像的多分辨率表示。然后,金字塔匹配内核被用来集成一个统一的表示。不同于空间金字塔模型,我们用低级别的描述符作为深度特征,从数据本身去学习出不同的卷积层之间最优融合权重,而不是预先定义。减少了固定的输入图像尺寸造成的信息损失,而且多尺度图像送入卷积神经网络可以从不同尺度学习出更多补充信息。考虑到学习多尺度深度特征的计算成本,我们选择带有空间金字塔池化的卷积神经网络作为我们的基本的深度网络。在全连接网络之前增加一个空间金字塔池化层,允许输入图像是任意大小的。因此,一个训练好的空间金字塔池化网络可以从多尺度输入图像中提取多尺度特征,从而有利于遥感场景的分类。
发明内容
本发明所要解决的技术问题在于克服现有技术不足,提供一种遥感场景分类方法,充分利用了多尺度深度特征提取和自适应深度金字塔匹配模型的优点,能够更好地对遥感场景进行分类,具有较好的分类性能和分类准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710147637.7/2.html,转载请声明来源钻瓜专利网。