[发明专利]基于半监督维数约减的高光谱图像分类方法有效
| 申请号: | 201110199094.6 | 申请日: | 2011-07-16 |
| 公开(公告)号: | CN102208034A | 公开(公告)日: | 2011-10-05 |
| 发明(设计)人: | 张向荣;焦李成;周楠;侯彪;李阳阳;刘若辰;公茂果;白静;马文萍;刘帅 | 申请(专利权)人: | 西安电子科技大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 王品华;朱红星 |
| 地址: | 710071*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 监督 维数约减 光谱 图像 分类 方法 | ||
技术领域
本发明属于图像处理技术领域,涉及高维数据的降维,用于对高光谱遥感图像的分类。
背景技术
高光谱遥感是遥感领域在20世纪80年代起最重要的发展之一,也是当今及今后几十年内遥感的前沿技术。高光谱遥感技术利用成像光谱仪以纳米级的光谱分辨率,以几十或几百个波段同时对地表物成像,能够获得地物的连续光谱信息,实现地物空间信息、辐射信息、光谱信息的同步获取,具有“图谱合一”的特性,从而使人类对地观测和信息获取能力向前迈进了一大步。
常用的高光谱图像数据包括由美国宇航局NASA喷气推进实验室的空载可见光/红外成像光谱仪AVIRIS获得的Indian Pine数据集和Kennedy Space Center(简称KSC)数据集,以及NASA的EO-I HYPERION光谱仪获得的Botswana数据集等。
遥感图像分类就是将遥感图像中的每个像元划归到类别中去的过程。高光谱图像分类是建立在遥感图像分类的基础上,结合高光谱遥感图像特点,对高光谱图像进行像元的识别和分类。由于高光谱遥感技术获取的图像包含了丰富的空间、辐射和光谱三重信息,这些信息特别适合分类,但仍存在巨大的挑战和困难:(1)数据量大,至少几十个波段,导致计算复杂度很高,也给数据的存储、传递和显示带来了挑战;(2)维数过高,存在冗余数据,会降低分类精度;(3)波段多,且波段间相关性高,导致所需训练样本数目增多,如果训练样本不足,将导致从训练样本得到的参数不可靠。因此如何有效的降低高光谱图像的维数,减少数据量是高光谱图像分类中的一个重要问题。
目前,已经有许多有效的维数约简方法,如主成分分析PCA,核主成分分析KPCA,线性判别分析LDA,核判别分析KDA,局部线性嵌入LLE等。在这些已有的降维方法中,PCA和LDA是最著名,也是应用最广的线性降维方法。PCA的主要目标是寻找在最小均方意义下最能代表原始数据的投影方向,该投影方向是通过线性变换得到的一组最优的单位正交向量基,这些向量的线性组合可以重构原始样本,并且重构后的样本和原样本之间的误差最小。PCA在许多模式识别应用中取得了较好的效果,但是由于它是一种无监督的降维方法,不适用于反映样本之间的差异。相对于PCA方法,LDA是一种有监督的线性降维方法,主要目标就是寻找在最小均方意义下,最能够分开各类数据的投影方向,实现上是通过寻找一组线性变换以达到类内散度最小且类间散度最大的目的。目前,LDA是最基本也是应用最广的降维方法。在此基础上,已经有学者利用核方法将PCA和LDA推广到非线性形式,得到核主成分分析KPCA和核判别分析KDA。
上述PCA和KPCA属于无监督降维方法,因为没有有效的监督信息即类别信息的指导,往往难以得到较好的后续分类结果;LDA和KDA属于有监督降维方法,其虽然可以充分利用大量的监督信息而取得较为理想的结果,但是获取大量监督信息需要付出很大的代价。尤其对于高光谱图像数据,其类别信息的获取是耗时耗力且非常困难的。
发明内容
本发明的目的在于同时利用少量的有标记数据以及大量的无标记数据,提出一种基于半监督维数约减的高光谱图像分类方法,以减小计算复杂度,并在有标记样本较少的情况下提高分类正确率。
实现本发明目的的技术方案是,在利用少量有标记样本提供判别信息的基础上,通过引入一个正则项,加入由大量无标记样本得到的几何结构信息,获得更优的低维空间,将原始高维数据转换到低维空间中再进行分类,从而获得更好的分类性能。其实现步骤包括如下:
(1)输入高光谱图像,该高光谱图像包含c类像素点,其中有N个有标记像素点,m个无标记像素点,图像的每一个像素点为一个样本,每个样本用一个特征向量表示,样本的特征维数为D;
(2)用N个有标记样本构成有标记训练集其对应的类别标记集为用m个无标记样本构成测试集其中,xi表示有标记训练集的第i个有标记训练样本,yj表示测试集的第j个测试样本,每个样本用一个列向量表示,li是第i个有标记训练样本所属的类别标号,N是有标记训练样本总个数,m是测试样本总个数,D表示样本的特征维数,R表示实数域;
(3)从m个无标记样本中选出η个,与N个有标记样本组合,得到总训练集其中,sk表示总训练集的第k个训练样本,总训练集的样本个数为N+η,D表示样本的特征维数,R表示实数域;
(4)构造有标记训练集X的局部类间不相似性矩阵和局部类内不相似性矩阵
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110199094.6/2.html,转载请声明来源钻瓜专利网。





