[发明专利]一种基于典型相关森林的土壤重金属特征选取方法及系统在审
申请号: | 202111207773.3 | 申请日: | 2021-10-18 |
公开(公告)号: | CN113868960A | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 王轩慧;油海东;王轩力 | 申请(专利权)人: | 青岛农业大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06K9/62;G06F111/08 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 董领逊 |
地址: | 266109 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 典型 相关 森林 土壤 重金属 特征 选取 方法 系统 | ||
1.一种基于典型相关森林的土壤重金属特征选取方法,其特征在于,包括:
获取N份原始土壤样本,采用模糊K平均聚类算法,并基于颜色参数对N份所述原始土壤样本重新分组,得到n组样本数据;所述样本数据包括高光谱数据和与所述高光谱数据对应的响应变量;
利用n组所述样本数据对典型相关森林回归模型进行训练,得到训练好的典型相关森林模型;
利用所述训练好的典型相关森林回归模型,得到每个所述高光谱数据的特征值的变量重要性得分;
根据所述变量重要性得分,确定特征值矩阵;
根据所述特征值矩阵,建立K个独立的典型相关森林回归子模型;
利用K个所述典型相关森林回归子模型对特征空间进行筛选与缩减变化,获得最优特征子集,完成土壤重金属特征的选取;所述特征空间为样本数量和特征值数量组成的矩阵。
2.根据权利要求1所述的基于典型相关森林的土壤重金属特征选取方法,其特征在于,所述获取N份原始土壤样本,采用模糊K平均聚类算法,并基于颜色参数对N份所述原始土壤样本重新分组,得到n组样本数据,具体包括:
获取每份所述原始土壤样本的Munsell颜色值;
将所述Munsell颜色值转换为CIE XYZ三刺激值;
将所述CIE XYZ三刺激值转化成多个颜色参数,多个所述颜色参数作为高光谱数据的特征值;
基于所述特征值,对所述高光谱数据进行主成分变换,确定每份所述原始土壤样本的主成分得分;
基于所述主成分得分,采用模糊K平均聚类算法确定最佳聚类数目;
根据所述最佳聚类数目将N份所述原始土壤样本重新划分成n组样本数据。
3.根据权利要求1所述的基于典型相关森林的土壤重金属特征选取方法,其特征在于,所述利用n组所述样本数据对典型相关森林回归模型进行训练,得到训练好的典型相关森林模型,具体包括:
将每一组所述样本数据转换成原始特征值向量Mi(i∈[1,n]),利用训练集对典型相关森林模型进行训练,得到训练好的典型相关森林模型;所述训练集从n个所述原始特征值向量中选取。
4.根据权利要求1所述的基于典型相关森林的土壤重金属特征选取方法,其特征在于,所述利用所述训练好的典型相关森林回归模型,得到每个特征值的变量重要性得分,具体包括:
计算所述训练好的典型相关森林回归模型中每棵决策树的第一袋外估计均方误差;
随机置换袋外数据集中第j个特征值,计算每棵决策树的第二袋外估计均方误差;
根据所述第一袋外估计均方误差和所述第二袋外估计均方误差,计算每棵决策树的袋外估计均方误差的减少量;
将所有决策树的所述减少量取平均值,得到每个特征值的变量重要性得分。
5.根据权利要求1所述的基于典型相关森林的土壤重金属特征选取方法,其特征在于,所述根据所述变量重要性得分,确定特征值矩阵,具体包括:
将所述变量重要性得分取平均值降序排序并选取预设个数的特征值;
根据选取后的特征值确定特征值矩阵。
6.根据权利要求1所述的基于典型相关森林的土壤重金属特征选取方法,其特征在于,所述对所述特征值矩阵进行去冗余处理,选取相应的特征值作为输入建立K个独立的典型相关森林回归子模型,具体包括:
根据一致权重向量将所述特征值矩阵转换成二进制矩阵A;
对所述二进制矩阵A进行初等行变换,确定所述二进制矩阵A的最大无关组,根据所述最大无关组对所述二进制矩阵A重新赋值,得到二进制矩阵B;
根据所述二进制矩阵B每一行中“1”的位置选取相应的特征值,根据选中的特征值建立K个独立的典型相关森林回归子模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛农业大学,未经青岛农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111207773.3/1.html,转载请声明来源钻瓜专利网。