[发明专利]一种水质异常检测方法及电子设备有效
申请号: | 202011626167.0 | 申请日: | 2020-12-30 |
公开(公告)号: | CN112733904B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 许红龙;郭沛清 | 申请(专利权)人: | 佛山科学技术学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G01K13/00;G01N33/18 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 刘俊文 |
地址: | 528000 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 水质 异常 检测 方法 电子设备 | ||
本发明公开了一种水质异常检测方法及电子设备,所述方法包括:计算水质数据集中所有水质数组与基准点的距离值,将所有距离值构成一维数据集;求一维数据集的每个对象的k最近邻,确定预阈值,另外,将有序的水质数据集划分为多个数据块,将预阈值作为离群度阈值,依次对每个数据块进行离群检测,将离群度阈值更新为已检测的数据块的第N大的离群度,将更新的离群度阈值作为下一个数据块进行离群检测的判断标准。在不需要预先知道部分水质异常点,也无须计算全局离群度的情况下,提高了离群检测速度,并且保证水质异常检测结果与传统基于距离的离群检测算法一致。
技术领域
本发明涉及水质检测技术领域,尤其涉及一种水质异常检测方法及电子设备。
背景技术
水对于水生生物、人类生活和工业生产至关重要。水体的洁净程度和各种化学成分含量,是确定水源用途和环保工作的重要依据。尤其是水体环保工作,环保资源的有限性决定了治理污水必须有的放矢,针对部分区域重点治理,而非广撒网。水质监测分析涉及化学需氧量COD、氨氮、总磷、溶解氧等及多种重金属含量指标,而不同的水质监测分析仪器囊括的指标并不完全相同。在通过仪器测定这些指标的数值之后,再分析和排序,根据排序靠前的水质样本,结合所在区域情况,确定重点治理水域。
在现有的水质异常检测方法中,广泛应用的是为水质监测分析仪器涉及的各项水质指标设定异常阈值,超过该阈值则视为该指标异常,下文称该方法为指标阈值法。在申请号为201910560024.5的发明专利“一种基于先验知识的异常水质检测方法及系统”中,应用了基于距离的离群检测算法,实现了对于不同监测分析仪器数据均能作水质的异常检测,且为加速离群检测过程,其利用了先验的水质异常点,提高离群度阈值,以提高检测速度,下文称该法为先验阈值法。
指标阈值法的缺陷在于需要领域专家知识,为之设定各个指标的异常阈值,且因同时使用多个水质指标,更难以判断哪些水质样本为异常,以及异常程度的排序。先验阈值法属于基于距离的离群检测算法,不需要领域专家知识,即可自动给出最异常的N个水质样本,但其加速效果依赖于预先知道的异常水质样本(先验样本),如果预先知道的异常样本数量过少,或者没有这些异常样本,检测的加速效果将大打折扣,甚至没能加速。此外,即使先验样本数量足够,为了获得先验阈值,仍然需要基于全局数据集检测其离群度。
发明内容
本发明提供一种水质异常检测方法及电子设备,以解决现有技术中所存在的一个或多个技术问题,至少提供一种有益的选择或创造条件。
第一方面,本发明实施例提供了一种水质异常检测方法,包括:
S101、获取多个水质数组,组成水质数据集,每个水质数组的维度相同,包括至少一个水质数据;
S102、在水质数据集中随机选择一个水质数组作为基准点;
S103、计算水质数据集中所有水质数组与基准点的距离值,将所有距离值构成一维数据集;
S104、对一维数据集的所有距离值进行降序排序得到有序的一维数据集,根据所述降序排序的顺序对水质数据集的所有水质数组进行排序得到有序的水质数据集,
S105、确定有序的一维数据集的每个对象的k最近邻,1≤k≤D*1%,其中D为水质数据集中水质数组的数量;
S106、计算有序的一维数据集的每个对象与其第k最近邻的距离值得到每个对象的离群度,一维数据集的所有对象的离群度构成一维离群度,根据一维离群度中每个离群度的大小,按从大到小的顺序选取最大N个离群度,并将第N大的离群度作为预阈值,其中第k最近邻为k最近邻中的第k个;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山科学技术学院,未经佛山科学技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011626167.0/2.html,转载请声明来源钻瓜专利网。