[发明专利]一种基于层次聚类的农田重金属污染物溯源方法有效

申请号：	201910937334.4	申请日：	2019-09-30
公开（公告）号：	CN110706004B	公开（公告）日：	2022-03-29
发明（设计）人：	王璐;胡月明;陈志奎;赵亮;杜佳宁;萧嘉明	申请（专利权）人：	华南农业大学;大连理工大学;广东友元国土信息工程有限公司
主分类号：	G06Q30/00	分类号：	G06Q30/00;G06V10/44
代理公司：	大连理工大学专利中心 21200	代理人：	梅洪玉
地址：	510642 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于层次农田重金属污染物溯源方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于层次聚类的农田重金属污染物溯源方法，其特征在于，包括以下步骤：

(1)对土壤样本数据集进行归一化和特殊值填充预处理

设整个待分析土壤样本数据集D＝{x₁,x₂,...,x_n}包含n个数据样本，每个样本有m个重金属集合，即A＝{a₁,a₂,...,a_m}；对所有土壤样本进行归一化处理，并将数据集中所有缺失数据属性值填充为不同于所有已知数据属性值的一个特殊值；

(2)计算任意样本对重金属间的相关性

首先，基于任意样本对之间的权重相等，首先计算任意两个样本的重金属间的距离相关性；具体为：定义表示样本数据x_n在a_m维度上的值，用公式Relation(i,j,k,l)表示重金属a_i与重金属a_j在第k行与第l行样本数据中呈现的距离相关性：

其中，为样本数据x_k中重金属a_i的值；为样本数据x_l中重金属a_i的值；为样本数据x_k中重金属a_j的值；为样本数据x_l中重金属a_j的值；

其次，基于学习到的任意样本对中重金属间的距离相关性，定义并计算出任意两个重金属在样本对中的相关性分数，函数Score(i,j,k,l)表示重金属a_i与重金属a_j在第k行与第l行样本数据中的相关性分数，公式如下：

(3)计算任意两种重金属间的相关性

首先，基于任意样本对重金属间相关性分数，定义并计算得到两个重金属间的相关性距离变量W_ij，W_ij表示第i种金属与第j种金属的关联性指数，计算公式如下：

其次，为了更直观地表示重金属间的相关性，进一步将相关性距离变量细化为百分比的表示形式；具体为：定义集合P为样本数据集D中任意两种重金属的相关性，即P＝{p₁₂,p₁₃,...,p_1m,...,p_(m-1)m}，其中p_ij表示重金属a_i与a_j的相关性百分比，如果p_ij值为100％，则表明在样本数据集中任意两组样本的重金属a_i与a_j都呈正相关趋势；p_ij的计算公式定义如下：

其中，公式(4)的分母表示重金属a_i与重金属a_j在所有样本数据中的比较次数，k表示第k个样本数据，l表示第l个样本数据；

(4)基于重金属间相关性对重金属集合进行自底向上的层次聚类

首先，基于步骤(1)-(3)获得样本数据集中任意两种重金属间的相关性集合P，对重金属间的相关性集合由大到小排序，并定义各重金属元素独自为一簇，且各元素的层级均为0；其次，获取相关性集合排序后的第一个元素，给定相关性百分比阈值K；如果该元素大于等于相关性百分比阈值，则该元素表示的两个重金属将聚为一簇；如果该元素表示的两个重金属中任意一种重金属或二者都已为某一簇的成员，则将两个簇继续聚为一簇；之后，将该簇的层级加一，并移除相关性集合中的第一个元素；如果相关性集合为空或该集合中下一个元素小于相关性百分比阈值，则算法结束；否则继续循环获取集中的第一个元素并执行聚簇步骤；

(5)定向解析农田重金属的污染物来源

首先，根据土壤环境质量评价标准，对所有样本的各重金属维度的含量进行判定，并计算单维度全采样点的污染程度，获得超标的重金属元素；其次，基于超标的重金属元素和重金属间的强关联性集合，并与土壤重金属的主要来源表进行对照和分析，从而定向解析出农田重金属的污染物来源。

2.根据权利要求1所述的一种基于层次聚类的农田重金属污染物溯源方法，其特征在于，步骤(4)中所述的相关性百分比阈值60％≤K≤80％。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南农业大学;大连理工大学;广东友元国土信息工程有限公司，未经华南农业大学;大连理工大学;广东友元国土信息工程有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910937334.4/1.html，转载请声明来源钻瓜专利网。

上一篇：一种客户反馈工单生成的方法、装置、设备以及存储介质
下一篇：一种基于GS1技术的食用水饺追溯系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法；其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q30-00 商业，例如购物或电子商务
G06Q30-02 .行销，例如，市场研究与分析、调查、促销、广告、买方剖析研究、客户管理或奖励；价格评估或确定
G06Q30-04 .签单或开发票
G06Q30-06 .购买、出售或租赁交易
G06Q30-08 ..拍卖

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于层次聚类的农田重金属污染物溯源方法有效

专利文献下载