[发明专利]一种最佳特征子集的确定方法有效
申请号: | 201810732008.5 | 申请日: | 2018-07-05 |
公开(公告)号: | CN109117956B | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 杨玲波;黄敬峰 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06N20/10 | 分类号: | G06N20/10;G06K9/62 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 陈升华 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 最佳 特征 子集 确定 方法 | ||
本发明公开了一种最佳特征子集确定方法,包括如下步骤:获取高分辨率影像,并进行预处理及面向对象分割,得到地物对象数据集;计算地物对象的各类特征,包括形状、指数、光谱、纹理等;从原始的地物对象数据集中挑选样本,包括训练样本、测试样本;基于交叉验证方法,以及随机森林、梯度提升决策树、支持向量机等机器学习方法,利用训练样本计算各特征的重要性,并使用改进的增强特征递归筛选方法对特征进行筛选,得到不同特征数量下,各特征子集的分类精度得分;依据得分最高的原则,确定各方法的分类最佳特征子集,剩余特征则作为冗余特征剔除。该方法简单、快速、准确。
技术领域
本发明涉及最佳分类特征子集获取技术领域,具体涉及一种最佳特征子集的确定方法。
背景技术
特征筛选是从原始特征集中剔除冗余特征,获取对于分类有效的最佳特征子集的过程,可以降低分类计算时间,提高分类精度。特征子集的评价方法往往通过预先定义的指标,如分类精度或类别可分离性等。特征筛选是机器学习方法中重要的一步,过多的特征可能造成分类精度的降低,分类时间的提高,被称为维数灾难(Pacifici et al.2009)。特征筛选的方式主要分为过滤式、封装式和嵌入式三种(Weston et al.2003)。过滤式方法所使用的特征子集评价方法是独立于分类器的,而嵌入式和封装式方法,特征筛选则是与分类器相结合的。对于嵌入式特征筛选方法,特征筛选是学习算法的一部分,并与特定的机器学习方法相绑定;而对于封装式,则封装了一个特定的学习算法用来评估最佳特征子集,并使分类结果的误差最小,最后建立起一个分类器。
递归特征筛选(Recursive feature elimination,RFE)是一种应用较为广泛的特征筛选技术,其通过训练模型评估每个特征的重要性并进行排序,逐步从特征集合中移除最不重要的特征,通过交叉验证的方式评价特征子集的性能,以此获取最佳特征集合(Guyon 2001)。由于RFE方法为嵌入式方法,利用RFE方法获取的特征子集往往可以较好地得到较高的分类精度。然而,重要性较低的特征在与其它特征组合后,可能对于分类精度具有较大的影响,单纯按照重要性排序进行特征筛选可能导致最佳特征子集的性能下降(Chen and Jeong 2007)。为解决这一问题,(Chen and Jeong 2007)提出了一种增强递归特征筛选(Enhanced recursive feature elimination,EnRFE)方法,通过搜索重要性较低且剔除后有助于分类精度提高的特征,从而提高搜索获取的最佳特征子集性能。然而,该方法依然存在两方面不足,其一是效率较低,其二是在未搜索到能提高分类精度的特征时直接剔除最不重要的特征,同样可能导致剔除后特征子集性能的大幅降低。
针对这一情况,本发明通过改进EnRFE方法存在的两个问题,从而提高特征筛选效率,并提高选择的最佳特征子集的表现,并基于该方法,建立从影像预处理、特征计算、特征筛选到影像分类的完整技术流程。
发明内容
本发明的目的是为机器学习中海量特征筛选,冗余特征剔除,提供一种简单、快速、准确的最佳特征子集的确定方法,基于改进增强特征递归筛选方法,其通过限制特征搜索的深度,并提高搜索算法的并行计算能力,从而提高特征筛选的效率,另一方面,将特征选择的评价依据从重要性的高低修改为交叉验证得分的高低,从而提高了最佳特征子集的表现。
一种最佳特征子集的确定方法,包括如下步骤:
步骤1、获取高分辨率影像,并进行预处理及面向对象分割,得到地物对象数据集;
步骤2、计算步骤1得到的地物对象数据集中各对象的形状类特征、指数类特征、光谱类特征、纹理类特征,作为初始特征集;
步骤3、从步骤1得到的地物对象数据集中挑选样本,得到训练样本和测试样本;
步骤4、将步骤3得到的训练样本输入到随机森林方法、梯度提升决策树方法或支持向量机方法中,计算步骤2中初始特征集中各类特征的重要性,并按照重要性由低到高排序,得到排序后的特征集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810732008.5/2.html,转载请声明来源钻瓜专利网。