[发明专利]一种基于聚类分析发现环境监测罕见数据组合模式的算法在审
| 申请号: | 201410685956.X | 申请日: | 2014-11-26 |
| 公开(公告)号: | CN104598514A | 公开(公告)日: | 2015-05-06 |
| 发明(设计)人: | 邹志强;王正 | 申请(专利权)人: | 北京金水永利科技有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 无 | 代理人: | 无 |
| 地址: | 100101 北京市朝阳区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 聚类分析 发现 环境监测 罕见 数据 组合 模式 算法 | ||
所属技术领域
本发明涉及一种基于聚类分析发现环境监测罕见数据组合模式的算法。该算法可以利用聚类分析原理,对环境监测数据的多参数数据组合的数据模式进行分析,发现其中所隐藏的历史罕见的监测数据组合模式,从而能够提醒环境监测人员的注意。
背景技术
在环境监测中,环境监测数据的异常变化可能是由监测数据质量问题导致,也可能是暗示环境的变化。因此,对于环境监测数据中异常数据的发现,可以协助环境监测部门发现环境监测数据质量问题,并对环境变化进行提前预警。作为异常数据的一种形式,当环境监测数据出现历史罕见的数据组合模式时,就需要提醒环境监测人员可能存在数据质量问题或可能出现环境变化。
本发明所描述的算法可以通过聚类分析对环境监测数据进行分析,以发现环境监测数据中出现的历史罕见数据组合模式。
发明内容
本发明所描述算法所考虑的环境监测数据并不局限于某特定的监测参数,而是综合考虑同一时刻的多个参数的监测数据组合。本发明所描述算法利用聚类分析原理,综合考虑多参数的监测数据组合,并与历史数据相对比,如果发现当前的数据组合模式在历史上出现的次数少于相应阈值时,该数据组合模式将被判定为历史罕见数据组合模式。
本发明的基本原理在于同地的环境监测数据是周期性变化的,如果出现历史罕见的数据组合,则可以认为此数据组合为异常情况,可能反映监测数据质量问题或环境的趋势性变化,因此应引起环境监测人员的重视。在算法方面,本发明采用网格法对多参数监测数据构建历史特征数据库,并以实时监测数据与历史特征数据库进行比较,如果当前实时监测数据组合在历史特征数据库中所出现次数低于设定阈值,则判定为该数据组合为历史罕见数据组合。
本发明的算法描述如图1所示,通过软件开发实现该算法,可以首先生成历史特征数据库,然后将当前环境监测数据组合与历史特征数据库相对比,如当前监测数据组合低于所设定阈值,则判定为环境监测罕见数据组合模式。
本发明的有益效果是:可以通过聚类分析的分析方法,发现环境监测数据中历史罕见数据组合数据异常,从而能够提醒环境监测人员检查监测数据质量或重视环境变化趋势。
附图说明
下面结合附图对本发明进一步说明。
图1基于聚类分析发现环境监测罕见数据组合模式的算法流程图
具体实施方式
在图1中,描述了基于聚类分析发现环境监测罕见数据组合模式的算法流程。主要步骤包括:
1、对不同监测参数组合(P个参数)进行统计分析,以每个监测参数为维度,将每个维度划分为D个等分,从而将该参数组合形式的所有取值划分为(D^P)个多 维网格
2、按照历史数据,计算该参数组合的历史数据在每个网格内出现的次数(N)
3、将网格组成和每个网格内数据出现次数形成历史特征数据库
4、将当前该监测参数数据组合的数据与历史特征数据库对比
5、罕见数据组合模式的判定:如当前监测数据组合所属网格对应历史数据组合出现次数(N)<设定阈值L,则判定该监测数据组合为环境监测罕见数据组合模式,否则不判定为环境监测罕见数据组合模式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金水永利科技有限公司;,未经北京金水永利科技有限公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410685956.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种信息处理方法及装置
- 下一篇:一种应用于手机的数据管理系统





