[发明专利]一种融合遗传算法和决策树算法的知识提取方法在审
申请号: | 202111089955.5 | 申请日: | 2021-09-17 |
公开(公告)号: | CN113869515A | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 赵传朋;王宗明;贾明明;任春颖;毛德华 | 申请(专利权)人: | 中林信达(北京)科技信息有限责任公司 |
主分类号: | G06N5/02 | 分类号: | G06N5/02;G06N5/00;G06N3/12;G06K9/62 |
代理公司: | 长春众邦菁华知识产权代理有限公司 22214 | 代理人: | 于晓庆 |
地址: | 100007 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 遗传 算法 决策树 知识 提取 方法 | ||
一种融合遗传算法和决策树算法的知识提取方法,涉及基于遥感影像的分类、数据挖掘等领域。本发明包括准备遥感分类结果与分类特征数据;分层随机抽取训练样本集;初始化遗传算法,通过随机产生的基因组合和样本构建决策树,模拟随机森林的随机特征和随机样本特性;对构建的任意一棵决策树筛选感兴趣类别的规则链,并根据规则获取分类结果;将筛选的分类结果与现有分类结果进行比对计算错误率作为评估函数的适应度,记录规则链和对应的错误率;迭代遗传算法至指定次数或满足收敛条件,将一系列规则按错误率从小到大排序,将错误率最小的规则作为显式知识。本发明能有效地将隐式知识转化为可理解的显式知识,具有一定的可重复性和鲁棒性。
技术领域
本发明涉及一种融合遗传算法和决策树算法的知识提取方法,涉及基于遥感影像的分类、数据挖掘等技术领域。
背景技术
随着Google Earth Engine等云平台的兴起,基于不同数据和算法的遥感分类结果不断增加。在应用这些遥感分类结果方面,现有方法多在这些结果中选取样本,并继续基于具有黑箱属性的算法产生新的分类结果。在这个过程中,分类相关的知识通过样本隐式地传递给新的分类,而人们无法获取、理解和应用这些知识,从而阻碍了认知的进步。
在这些具有黑箱属性的算法中,决策树分类接近于人对事物的简单描述。以遥感分类中的水体识别为例,人们通过归一化水体指数(NDWI)的阈值threshold可分离水体和非水体,这一方式可简化表述为NDWIthreshold,而决策树算法产生的规则形式与此相同。对于阈值,人们的阈值通过大量实践总结而来,决策树的阈值通过算法计算得到。那么,在现有分类结果的基础上构建决策树,可获取其中的知识。
由于决策树的构建使用了贪心搜索策略,无法保证全局最优,即提取的知识存在偏差。通过样本随机和特征随机的方式,以一系列决策树组合而成的随机森林算法具备相对决策树更好的分类表现。但是,聚合了一系列决策树的随机森林算法给出的规则过于繁冗。
发明内容
为了解决从现有分类结果中获取可理解的显式知识的问题,本发明提供一种融合遗传算法和决策树算法的知识提取方法。本发明以遗传算法模拟样本随机和特征随机,并创建一系列决策树以筛选其规则,可以将隐式知识有效转化为人们可以理解的显式知识。
本发明为解决技术问题所采用的技术方案如下:
本发明的一种融合遗传算法和决策树算法的知识提取方法,包括以下步骤:
步骤一、准备现有遥感分类结果数据与遥感分类特征数据,利用Google EarthEngine云平台获取遥感分类结果区域的遥感分类特征影像作为遥感分类特征数据;
步骤二、根据现有遥感分类结果数据以分层随机抽样方式获取训练样本集;
步骤三、初始化遗传算法,取基因数量为遥感分类特征数量;通过遗传算法的迭代产生的不同基因组合模拟随机森林算法的特征随机;
步骤四、创建遗传算法的评估函数,并在此函数中以随机抽样方式在训练样本集中获取样本,所获取的样本比例介于50%到90%之间,用于模拟随机森林算法的样本随机;
步骤五、在遗传算法的评估函数中,以随机特征和随机样本构建决策树,提取该决策树产生的规则;
步骤六、在遗传算法的评估函数中,遍历该决策树产生的规则,并筛选与感兴趣地类相关的规则;参照这些规则对相关遥感分类特征进行分类,以获取随机特征和随机样本下感兴趣地类规则所对应的分类结果;
步骤七、在遗传算法的评估函数中,将基于规则得到的分类结果与现有遥感分类结果进行比较,根据规则链计算得到的分类结果与现有遥感分类结果采用逐像素比较的方式计算错误率,并将该错误率作为评估函数的适应度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中林信达(北京)科技信息有限责任公司,未经中林信达(北京)科技信息有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111089955.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于遗传算法的分类规则阈值优化方法
- 下一篇:一种农业用肥料混合装置