[发明专利]一种基于层次聚类的农田重金属污染物溯源方法有效
申请号: | 201910937334.4 | 申请日: | 2019-09-30 |
公开(公告)号: | CN110706004B | 公开(公告)日: | 2022-03-29 |
发明(设计)人: | 王璐;胡月明;陈志奎;赵亮;杜佳宁;萧嘉明 | 申请(专利权)人: | 华南农业大学;大连理工大学;广东友元国土信息工程有限公司 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06V10/44 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 梅洪玉 |
地址: | 510642 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 层次 农田 重金属 污染物 溯源 方法 | ||
1.一种基于层次聚类的农田重金属污染物溯源方法,其特征在于,包括以下步骤:
(1)对土壤样本数据集进行归一化和特殊值填充预处理
设整个待分析土壤样本数据集D={x1,x2,...,xn}包含n个数据样本,每个样本有m个重金属集合,即A={a1,a2,...,am};对所有土壤样本进行归一化处理,并将数据集中所有缺失数据属性值填充为不同于所有已知数据属性值的一个特殊值;
(2)计算任意样本对重金属间的相关性
首先,基于任意样本对之间的权重相等,首先计算任意两个样本的重金属间的距离相关性;具体为:定义表示样本数据xn在am维度上的值,用公式Relation(i,j,k,l)表示重金属ai与重金属aj在第k行与第l行样本数据中呈现的距离相关性:
其中,为样本数据xk中重金属ai的值;为样本数据xl中重金属ai的值;为样本数据xk中重金属aj的值;为样本数据xl中重金属aj的值;
其次,基于学习到的任意样本对中重金属间的距离相关性,定义并计算出任意两个重金属在样本对中的相关性分数,函数Score(i,j,k,l)表示重金属ai与重金属aj在第k行与第l行样本数据中的相关性分数,公式如下:
(3)计算任意两种重金属间的相关性
首先,基于任意样本对重金属间相关性分数,定义并计算得到两个重金属间的相关性距离变量Wij,Wij表示第i种金属与第j种金属的关联性指数,计算公式如下:
其次,为了更直观地表示重金属间的相关性,进一步将相关性距离变量细化为百分比的表示形式;具体为:定义集合P为样本数据集D中任意两种重金属的相关性,即P={p12,p13,...,p1m,...,p(m-1)m},其中pij表示重金属ai与aj的相关性百分比,如果pij值为100%,则表明在样本数据集中任意两组样本的重金属ai与aj都呈正相关趋势;pij的计算公式定义如下:
其中,公式(4)的分母表示重金属ai与重金属aj在所有样本数据中的比较次数,k表示第k个样本数据,l表示第l个样本数据;
(4)基于重金属间相关性对重金属集合进行自底向上的层次聚类
首先,基于步骤(1)-(3)获得样本数据集中任意两种重金属间的相关性集合P,对重金属间的相关性集合由大到小排序,并定义各重金属元素独自为一簇,且各元素的层级均为0;其次,获取相关性集合排序后的第一个元素,给定相关性百分比阈值K;如果该元素大于等于相关性百分比阈值,则该元素表示的两个重金属将聚为一簇;如果该元素表示的两个重金属中任意一种重金属或二者都已为某一簇的成员,则将两个簇继续聚为一簇;之后,将该簇的层级加一,并移除相关性集合中的第一个元素;如果相关性集合为空或该集合中下一个元素小于相关性百分比阈值,则算法结束;否则继续循环获取集中的第一个元素并执行聚簇步骤;
(5)定向解析农田重金属的污染物来源
首先,根据土壤环境质量评价标准,对所有样本的各重金属维度的含量进行判定,并计算单维度全采样点的污染程度,获得超标的重金属元素;其次,基于超标的重金属元素和重金属间的强关联性集合,并与土壤重金属的主要来源表进行对照和分析,从而定向解析出农田重金属的污染物来源。
2.根据权利要求1所述的一种基于层次聚类的农田重金属污染物溯源方法,其特征在于,步骤(4)中所述的相关性百分比阈值60%≤K≤80%。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南农业大学;大连理工大学;广东友元国土信息工程有限公司,未经华南农业大学;大连理工大学;广东友元国土信息工程有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910937334.4/1.html,转载请声明来源钻瓜专利网。