[发明专利]一种基于遗传算法的分类规则阈值优化方法在审
申请号: | 202111089890.4 | 申请日: | 2021-09-17 |
公开(公告)号: | CN113869513A | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 赵传朋;贾明明;王宗明;任春颖;毛德华 | 申请(专利权)人: | 中林信达(北京)科技信息有限责任公司 |
主分类号: | G06N3/12 | 分类号: | G06N3/12;G06K9/62 |
代理公司: | 长春众邦菁华知识产权代理有限公司 22214 | 代理人: | 于晓庆 |
地址: | 100007 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 遗传 算法 分类 规则 阈值 优化 方法 | ||
一种基于遗传算法的分类规则阈值优化方法,涉及基于遥感影像的分类、数据挖掘等领域,本发明根据分类规则准备遥感分类特征和现有分类结果,查找分类规则涉及的特征并计算其值域作为优化阈值上下限,以分类规则阈值为推荐阈值;初始化遗传算法并在评估函数中根据规则和随机生成的阈值对遥感分类特征进行分类,与现有分类结果比较并计算错误率作为当前阈值的适应度;在监控函数中记录每一代最小错误率,在最小错误率不变时结束迭代;运行遗传算法,在最小错误率不变时得到一系列阈值和最小错误率;最小错误率对应的阈值即为优化阈值。本发明能高效优化分类规则的阈值,克服了分类规则涉及多个指标时目视判断方法难以有效优化其阈值的问题。
技术领域
本发明涉及一种基于遗传算法的分类规则阈值优化方法,涉及基于遥感影像的分类、数据挖掘等技术领域。
背景技术
随着大数据等技术的进步,人们已不再满足于仅获取较好的分类结果,开始挖掘产生这一分类结果的分类规则。在遥感影像分类方面,人们已通过大量实践总结了一系列的分类规则,如归一化植被指数(NDVI)可以识别植被。但是,这类规则的阈值是变化的,如植被的类型、植被的生长状况均会影响NDVI值。那么,为了应用这些规则,需要手动调整阈值,并使用目视方法判断阈值的可用性。当分类规则涉及多个指标时,这些阈值将难以高效调整。
遗传算法通过模拟群落在自然筛选情况下的进化过程,可以对分类规则的各指标阈值进行迭代优化,获取最贴近当前区域的阈值。应用更新后的分类规则,可以获取相对更新前更优的分类结果,也可以克服区域研究区域调整、影像成像时间不同等带来的差异。
目前,基于遗传算法的分类规则阈值优化方法还未见报道。
发明内容
为了解决现有的遥感技术难以高效调整分类规则阈值的问题,本发明提供一种基于遗传算法的分类规则阈值优化方法。
本发明为解决技术问题所采用的技术方案如下:
本发明的一种基于遗传算法的分类规则阈值优化方法,包括以下步骤:
步骤一、准备遥感数据,包括现有分类结果数据和分类特征数据;
步骤二、根据所提供的分类规则拆分出此分类规则所涉及的分类特征和阈值,所提供的阈值作为遗传算法的推荐解;
步骤三、统计分类特征在分类特征数据中的值域,用于约束遗传算法的优化过程;
步骤四、初始化遗传算法,将步骤三中得到的分类特征在分类特征数据中的值域范围作为阈值的下限和上限,指定推荐解为步骤二中提供的阈值;
步骤五、创建遗传算法的评估函数,根据分类规则及相应阈值进行分类,与现有分类结果数据进行比较并计算错误率,将此错误率作为评估函数的适应度;
步骤六、创建遗传算法的监控函数,记录每一代的最小错误率,并在最小错误率不再改变时结束迭代;
步骤七、重复步骤四至步骤六对遗传算法进行迭代,直至当前最小错误率不再改变,得到一系列阈值和对应的最小错误率,最小错误率对应的阈值即为优化阈值。
进一步的,步骤一中,选择2019年吉林向海国家级自然保护区的部分湿地解译结果作为现有分类结果数据;利用Google Earth Engine云平台将相关特征合并成为一幅影像作为分类特征数据。
进一步的,步骤三中,采用R语言quantile函数获取1%分位数作为阈值下限,获取99%分位数作为阈值上限。
进一步的,步骤四中,基于R语言genalg包rbga函数初始化遗传算法,将计算的阈值下限、阈值上限、推荐阈值传递给初始化函数,种群规模设为200,迭代次数设为100,变异率为0.01。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中林信达(北京)科技信息有限责任公司,未经中林信达(北京)科技信息有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111089890.4/2.html,转载请声明来源钻瓜专利网。