[发明专利]一种基于多核机器学习的不平衡高光谱图像分类方法在审
申请号: | 202110528831.6 | 申请日: | 2021-05-14 |
公开(公告)号: | CN113283482A | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 汪洪桥;汪羚;付光远;姚钧译;张少磊;王冕;贾晓雅 | 申请(专利权)人: | 中国人民解放军火箭军工程大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 张海平 |
地址: | 710025 陕西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多核 机器 学习 不平衡 光谱 图像 分类 方法 | ||
本发明公开了一种基于多核机器学习的不平衡高光谱图像分类方法,包括以下步骤:1)获取原始样本,通过原始样本构建原始训练集X,得原始训练集X的Gram矩阵;2)根据原始训练集X的Gram矩阵计算扩展合成Gram矩阵Km;3)根据扩展合成Gram矩阵Km构建多核模型,然后基于多核模型,计算MKLMO目标函数,得最优内核函数权系数及拉格朗日乘子4)将最优内核函数权系数及拉格朗日乘子代入到决策函数中,将待分类样本代入决策函数中,得待分类样本的类别,完成基于多核机器学习的不平衡高光谱图像分类,该方法对样本特性的适应能力较强,分类效果优异。
技术领域
本发明涉及一种类不平衡数据的模式分类方法,具体涉及一种基于多核机器学习的不平衡高光谱图像分类方法。
背景技术
高光谱图像分类是近年来遥感领域最活跃的研究课题之一,其旨在利用丰富的地物光谱信息和空间信息,为高光谱图像中的每个像元分配唯一的地物类别标签,可广泛应用于环境监测、国防、精细化农业和城市制图等。然而,高光谱成像仪捕获的图像场景中不同目标地物往往尺度不一,并且手动标记样本往往非常困难并且代价高昂,导致获得的有限数量的标记样本往往分布不平衡,即各类地物训练样本数目存在巨大差异。目前,已经专门为高光谱数据开发了各种各样的光谱分类方法,例如决策树、神经网络、随机森林以及稀疏表示分类等。特别的,支持向量机凭借能够以小样本处理高维数据引起了研究者们极大的关注,并且通过引入核技巧,它可以自然推广到非线性分类问题。但不幸的是,这些学习算法都是基于平衡数据设计的,并且只关注于总体分类精度,这导致他们容易忽略少数类偏向多数类。然而,在些现实遥感问题中的这些少数类地物往往比多数类地物更有价值。
一般处理不平衡问题的方法统称为类不平衡学习(Class Imbalance Learning,CIL)方法,大致可分为数据层面和算法层面两类。
第一类数据层面方法,主要通过对多数类进行欠采样或者对少数类进行过采样使其在类分布上达到平衡。欠采样通过在多数类样本集中随机选择一些样本剔除,从而使样本分布均衡,然而,它也带来了一些衍生问题,例如增加了分类器的方差,扭曲了后验概率,还会造成一些重要信息的缺失。过采样通过简单复制少数类样本来扩大原始数据集中少数类样本,但是这样容易造成模型过拟合,为了解决过拟合问题,出现了合成少数类过采样技术(Synthetic Minority Oversampling Technique,SMOTE),基本思想是在相邻的少数类样本之间进行线性插值来生成新的少数类样本,从而提高算法的泛化性能。但这些方法大都是在原始输入空间进行数据处理的,当与核分类器(例如SVM)结合时会引起失真和不一致。
第二类是算法层面的方法,主要是通过修改算法对不同类别样本误分类成本,来降低对类不平衡的敏感度。例如在现实任务中,医疗辅助系统把患者错误诊断为健康人比把健康人错误诊断为患者的代价大得多,前者可能会耽误患者的最佳治疗时间,后者会增加进一步检查带来的资源浪费。为了权衡不同类型错误造成的不同损失,通常会对少数类样本误分类成多数类施加更高的惩罚。考虑到支持向量机对噪声、离群点和类不平衡的敏感,通过定义模糊隶属度赋予不同类别样本对分类器的贡献,可以使得少数类受到更多关注,但是上述隶属度通常是基于欧式距离的,因此对于某些复杂的数据分布,模型表现不佳。
但是很多研究都已证明不平衡分布不是导致分类器性能下降的唯一缺点。相反,不平衡数据中的一些不规则结构(如小析取,类重叠以及非线性)才是限制模型的原因。例如对于遥感影像,由于大气、光照、气候等条件差异的影响,造成特征不确定和分布不规则,极大地影响分类质量。然而,目前无论是数据层面还是算法层面的方法,大多需要事先假设数据概率分布,结合基于单个特征空间的单核方法来解决实际的复杂非线性分布问题。但是对于遥感影像其数据分布通常是未知且非平稳的,使用特定的核函数会降低模型对样本特性适应能力,引起模型偏见,导致学习性能不尽人意。
发明内容
本发明的目的在于克服上述现有技术的缺点,提供了一种基于多核机器学习的不平衡高光谱图像分类方法,该方法对样本特性的适应能力较强,分类效果优异。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军火箭军工程大学,未经中国人民解放军火箭军工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110528831.6/2.html,转载请声明来源钻瓜专利网。