[发明专利]一种融合遗传算法和决策树算法的知识提取方法在审
申请号: | 202111089955.5 | 申请日: | 2021-09-17 |
公开(公告)号: | CN113869515A | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 赵传朋;王宗明;贾明明;任春颖;毛德华 | 申请(专利权)人: | 中林信达(北京)科技信息有限责任公司 |
主分类号: | G06N5/02 | 分类号: | G06N5/02;G06N5/00;G06N3/12;G06K9/62 |
代理公司: | 长春众邦菁华知识产权代理有限公司 22214 | 代理人: | 于晓庆 |
地址: | 100007 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 遗传 算法 决策树 知识 提取 方法 | ||
1.一种融合遗传算法和决策树算法的知识提取方法,其特征在于,包括以下步骤:
步骤一、准备现有遥感分类结果数据与遥感分类特征数据,利用Google Earth Engine云平台获取遥感分类结果区域的遥感分类特征影像作为遥感分类特征数据;
步骤二、根据现有遥感分类结果数据以分层随机抽样方式获取训练样本集;
步骤三、初始化遗传算法,取基因数量为遥感分类特征数量;通过遗传算法的迭代产生的不同基因组合模拟随机森林算法的特征随机;
步骤四、创建遗传算法的评估函数,并在此函数中以随机抽样方式在训练样本集中获取样本,所获取的样本比例介于50%到90%之间,用于模拟随机森林算法的样本随机;
步骤五、在遗传算法的评估函数中,以随机特征和随机样本构建决策树,提取该决策树产生的规则;
步骤六、在遗传算法的评估函数中,遍历该决策树产生的规则,并筛选与感兴趣地类相关的规则;参照这些规则对相关遥感分类特征进行分类,以获取随机特征和随机样本下感兴趣地类规则所对应的分类结果;
步骤七、在遗传算法的评估函数中,将基于规则得到的分类结果与现有遥感分类结果进行比较,根据规则链计算得到的分类结果与现有遥感分类结果采用逐像素比较的方式计算错误率,并将该错误率作为评估函数的适应度;
步骤八、重复步骤三至步骤七迭代遗传算法,直至达到指定迭代次数或满足收敛条件时停止迭代,得到一系列规则和对应的错误率;按错误率从小到大对规则进行排序,得到最贴近现有遥感分类结果的规则,将错误率最小的规则作为显式知识。
2.根据权利要求1所述的一种融合遗传算法和决策树算法的知识提取方法,其特征在于,步骤一中,选择2020年吉林向海国家级自然保护区的部分湿地解译结果作为现有遥感分类结果数据;利用Google Earth Engine云平台获取2020年吉林向海国家级自然保护区的5月到10月的Sentinel-1SAR影像、Sentinel-2MSI影像并分别进行中值合成,计算各分类特征并与波段特征合并为遥感分类特征影像,得到遥感分类特征数据。
3.根据权利要求2所述的一种融合遗传算法和决策树算法的知识提取方法,其特征在于,步骤二中,利用R语言raster包的sampleStratified函数,根据现有遥感分类结果数据以分层随机抽样方式进行随机抽样;对2020年吉林向海国家级自然保护区的湿地和非湿地类别按照等比例进行随机采集,得到总样本容量为20000的训练样本集;用rowFromCell函数和colFromCell函数遍历训练样本集,根据位置获取样本对应的特征。
4.根据权利要求3所述的一种融合遗传算法和决策树算法的知识提取方法,其特征在于,步骤三中,利用R语言genalg包rbga.bin函数初始化遗传算法;基因数量设为分类特征数量,种群规模设为200,迭代次数设为100,变异率设为0.01。
5.根据权利要求4所述的一种融合遗传算法和决策树算法的知识提取方法,其特征在于,步骤四中,编写遗传算法的evalFunc函数,利用R语言createDataPartition函数获取75%的样本用于训练决策树,剩余部分直接丢弃,以此模拟样本随机。
6.根据权利要求5所述的一种融合遗传算法和决策树算法的知识提取方法,其特征在于,步骤五中,在evalFunc函数中,利用R语言rpart包的rpart函数构建决策树,得到特征随机和样本随机情况下的一棵决策树。
7.根据权利要求6所述的一种融合遗传算法和决策树算法的知识提取方法,其特征在于,步骤六中,在evalFunc函数中,遍历该决策树的产生规则,选取湿地有关的规则对遥感分类特征数据进行分类,得到分类结果。
8.根据权利要求7所述的一种融合遗传算法和决策树算法的知识提取方法,其特征在于,步骤七中,在evalFunc函数中,将按规则得到的分类结果与现有遥感分类结果进行比较,并计算错误率作为evalFunc函数的适应度。
9.根据权利要求7所述的一种融合遗传算法和决策树算法的知识提取方法,其特征在于,步骤八中,运行rbga.bin函数,不断迭代优化,直至达到指定迭代次数或满足收敛条件时停止迭代,得到一系列规则和对应的错误率,错误率最小的规则即为表征湿地的显式知识。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中林信达(北京)科技信息有限责任公司,未经中林信达(北京)科技信息有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111089955.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于遗传算法的分类规则阈值优化方法
- 下一篇:一种农业用肥料混合装置