[发明专利]基于数据挖掘的场地污染特征因子识别和监测指标优化方法在审

专利信息
申请号: 202011182291.2 申请日: 2020-10-29
公开(公告)号: CN112347155A 公开(公告)日: 2021-02-09
发明(设计)人: 施小清;马春龙;莫绍星;徐红霞;吴吉春 申请(专利权)人: 南京大学
主分类号: G06F16/2458 分类号: G06F16/2458;G06K9/62;G06N3/04;G06N3/08;G06Q10/04;G06Q10/06;G06Q50/26
代理公司: 南京苏高专利商标事务所(普通合伙) 32204 代理人: 柏尚春
地址: 210023 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 数据 挖掘 场地 污染 特征 因子 识别 监测 指标 优化 方法
【权利要求书】:

1.一种基于数据挖掘的场地污染特征因子识别和监测指标优化方法,其特征在于,包括以下步骤:

(1)对预先获取的污染场地的地下水污染数据进行预处理;

(2)构建自组织映射神经网络模型,完成模型训练后开展数据降维、相关性解析、可视化分析数据挖掘任务;

(3)对自组织映射分类结果进一步采用K均值算法进行无监督聚类学习,实现特征因子的识别;

(4)对污染指标采取先分类后分级的策略,优化指标的后期监测过程。

2.根据权利要求1所述的基于数据挖掘的场地污染特征因子识别和监测指标优化方法,其特征在于,所述步骤(1)包括以下步骤:

(11)数据格式标准化:所有污染指标名称位于第一行,按列排,监测点位名称位于最后一列,按行排;

(12)低于检测限的数据值默认设为0;

(13)剔除存在明显有误的属性值;

(14)剔除在所有样本点的属性值均低于检测限或在检测限上下轻微浮动的污染指标。

3.根据权利要求1所述的基于数据挖掘的场地污染特征因子识别和监测指标优化方法,其特征在于,所述步骤(2)包括以下步骤:

(21)利用MATLAB软件构建神经网络模型,构建的神经网络模型输出层神经元数量为n为样本数量;同时输出层神经网络尺寸应根据平均量化误差和拓扑误差的大小来设置,两者达到最小值时为最优尺寸;

(22)构建完成的神经网络模型中输入步骤(1)已预处理的数据,模型运行完成后输出所有污染指标自组织映射图;

(23)污染指标自组织映射(图2)为高维污染数据的降维结果展示,根据自组织映射图中颜色梯度的相似性可判断相关性,梯度越相近,相关性越高。

4.根据权利要求1所述的基于数据挖掘的场地污染特征因子识别和监测指标优化方法,其特征在于,所述步骤(3)包括以下步骤:

(31)对自组织映射输出的距离权重U-matrix采用K均值算法进一步开展无监督聚类学习,选择DB指数作为聚类性能度量,最小DB指数对应的聚类数即最优聚类;

(32)根据地下水质量标准筛选部分存在超标严重的指标,同时计算超标指标在所有聚类中的权重分布,若污染指标在所有聚类中均有相当权重,则被确定为该污染场地的污染特征因子即特征污染物。

5.根据权利要求1所述的基于数据挖掘的场地污染特征因子识别和监测指标优化方法,所述步骤(4)实现过程如下:

(41)在场地后续的污染物监测中采用先分类后分级的优化策略,首先根据前述步骤的最终聚类实现,将所有待监测指标进行分类;

(42)依据污染指标超标倍数以及环境风险对污染指标进行排序任务,根据实际情况在每一类中仅选取少数污染指标供后续监测。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011182291.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top