[发明专利]一种基于遗传算法的多知识集成与优化方法在审
申请号: | 202111089838.9 | 申请日: | 2021-09-17 |
公开(公告)号: | CN113869514A | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 赵传朋;毛德华;贾明明;王宗明;任春颖 | 申请(专利权)人: | 中林信达(北京)科技信息有限责任公司 |
主分类号: | G06N5/02 | 分类号: | G06N5/02;G06N3/12 |
代理公司: | 长春众邦菁华知识产权代理有限公司 22214 | 代理人: | 于晓庆 |
地址: | 100007 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 遗传 算法 知识 集成 优化 方法 | ||
一种基于遗传算法的多知识集成与优化方法,涉及基于遥感影像的分类、数据挖掘等领域。本发明根据遥感分类特征数据、现有分类结果和以规则表述的知识,根据规则对应的阈值方向剔除重复特征、统计非重复特征的值域和当前阈值,约束外层遗传算法的基因数量和内层遗传算法的阈值优化上下限和推荐解;利用遗传算法实现规则中冗余特征的去除和阈值优化目标,外层遗传算法产生随机特征组合,内层遗传算法根据随机特征组合优化其阈值,并将迭代的最优适应度返回给外层遗传算法的评估函数,迭代产生的不同特征组合;最优适应度对应的特征组合与阈值组成多知识集成优化结果。本发明能有效集成和优化以规则表示的不同知识,有效减少冗余规则、优化规则阈值。
技术领域
本发明涉及一种基于遗传算法的多知识集成与优化方法,涉及基于遥感影像的分类、数据挖掘等技术领域。
背景技术
随着大量数据样本的积累和相关处理平台、算法等的普及,从这些数据中抽取有用知识成为一个热点。即便对于同一个对象,受样本、算法、区域等差异的影响,得到的知识往往是不同的。以遥感分类中湿地的识别为例,部分知识倾向于根据植被识别湿地,部分知识倾向于根据季节性水体识别湿地。当涉及同一对象的知识较多时,往往难以判断这些知识孰优孰劣,更难以有效利用这些知识。因此,需要发展多知识集成与优化方法。
这些不同的知识可以表述为不同的规则链。例如,根据植被识别湿地可以表述为“植被指数阈值1植被指数=阈值2”,根据季节性水体识别湿地可以表述为“水指数阈值1水指数=阈值2”,那么多知识集成与优化所解决的问题可表述为如何根据两个规则获取最优的湿地识别规则,包括冗余规则的剔除和新规则阈值的优化两个方面。遗传算法可以筛选离散状态的规则,解决知识集成过程中的规则冗余问题;也可以优化求解连续状态下的规则阈值,解决知识集成过程中阈值的进一步优化问题。现有技术中未给出多知识集成与优化问题的具体解决手段。
发明内容
为了解决以规则表述的知识在集成过程中面临的规则冗余和规则阈值不适配的问题,本发明提供一种基于遗传算法的多知识集成与优化方法。
本发明为解决技术问题所采用的技术方案为:
本发明的一种基于遗传算法的多知识集成与优化方法,包括以下步骤:
步骤一、准备遥感分类特征数据、现有分类结果数据和以规则表述的知识;
步骤二、剔除不同规则中特征重复的部分,将多条有效规则合并为一条规则;
步骤三、根据处理后的规则统计所涉及特征的值域作为阈值优化的下限和上限,并拆分出阈值作为优化的推荐解;
步骤四、初始化遗传算法1,取处理后规则的特征数为基因数量;
步骤五、创建遗传算法1的评估函数,并在此函数中初始化遗传算法2,指定优化阈值的最小值、最大值和推荐解;
步骤六、创建遗传算法2的评估函数,根据随机产生的规则进行分类,与现有分类结果进行比较并计算正确率,将此正确率作为评估函数的适应度;
步骤七、创建遗传算法2的监控函数,记录每一代的最优适应度;最优适应度不再改变时退出迭代;
步骤八、重复步骤五至步骤七对遗传算法2进行迭代,将返回的最优适应度和相应的阈值记录下来,作为遗传算法1产生的随机特征的阈值和适应度,并缓存该记录;
步骤九、创建遗传算法1的监控函数,记录每一代的最优适应度,并在最优适应度不再改变时退出迭代;
步骤十、重复步骤四至步骤八对遗传算法1进行迭代,得到一系列特征组合、相应阈值和最优适应度;最优适应度对应的特征组合和相应阈值组成的规则即为多知识集成与优化结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中林信达(北京)科技信息有限责任公司,未经中林信达(北京)科技信息有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111089838.9/2.html,转载请声明来源钻瓜专利网。