[发明专利]一种GIS异常数据的检测方法有效
| 申请号: | 201810190958.X | 申请日: | 2018-03-08 |
| 公开(公告)号: | CN108446349B | 公开(公告)日: | 2022-03-25 |
| 发明(设计)人: | 李熠;冯世林;何明;高剑;李坚;罗荣森;张燃;黄琦;滕予非;张为金 | 申请(专利权)人: | 国网四川省电力公司电力科学研究院;电子科技大学 |
| 主分类号: | G06F16/29 | 分类号: | G06F16/29 |
| 代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 温利平 |
| 地址: | 610031 四川省成*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 gis 异常 数据 检测 方法 | ||
本发明公开了一种GIS异常数据的检测方法,在GIS数据的预处理时,先处理其常见的数据长度不标准,数据格式不规范,经度和纬度的交叉错误;然后对预处理后相对标准的数据我们再使用孤立森林对数据建立异常检测模型,识别出其中的异常坐标,并且对新增的数据此模型可以迅速的识别其是正常值还是异常值;本方法复杂度较低,非常适用于大数据的异常检测,能够适应GIS数据日益增长的趋势。
技术领域
本发明属于电力系统技术领域,更为具体地讲,涉及一种GIS异常数据的检测方法。
背景技术
GIS数据是重要的记录变电站地理位置信息的数据。变电站地理位置信息数据是非常重要的数据,其直接影响到所有基于地理位置信息构建的服务和应用。
但是电网的GIS数据却存在大量异常问题,数据存在格式混乱,如:数据长短不一,部分列数据缺失;坐标记录错误,如:经纬度的值有度分秒与小数两种格式混用,经度与纬度记录位置交叉等问题。
由于GIS数据会随时的增加,而如果每次增加数据都把所有数据重新再处理一遍,就会太过低效。isolationForest(孤立森林)是一种高效的异常检测算法,检测速度快,性能好,特别适合大数据做实时的异常检测。所以在经过规范处理之后,将规范的数据作为,isolationForest的训练数据,得到异常检测模型。以后对GIS增加的数据,都先通过这个模型进行判断,如果通过异常检测则插入数据库,如果识别为异常数据则标记。
发明内容
本发明的目的在于克服现有技术的不足,提供一种GIS异常数据的检测方法,利用孤立森林异常检测模型来判断待检测数据,具体简单、快速且准确等特点。
为实现上述发明目的,本发明一种GIS异常数据的检测方法,其特征在于,包括以下步骤:
(1)、GIS异常数据预处理
对存储GIS异常数据的数据表进行按行读取,再以每一行中单个GIS异常数据为单位,将每一行GIS异常数据分割为一个数组,并取数组长度;
以数据表表头规定长度为标准,判断每一个数组长度是否出现异常,如果出现异常,则将数组长度小于表头规定长度的数组,在数组尾部补空字符,使其长度相等,或者将数组长度大于表头规定长度的数组,在数组尾部截掉大于表头规定长度的部分,使其长度相等;如果未出现异常,则保持不变;
(2)、数据表中存储的坐标数据并处理
读取数据表中坐标数据,包括经度和纬度,统一成[经度,纬度]的形式,再将[经度,纬度]统一为浮点数;
比较[经度,纬度]中经度数值与纬度数值的大小,如果经度数值小于纬度数值,则将经度数值与纬度数值交换位置,否则保持不变;
(3)、对经度数值(longitude)与纬度数值(latitude)的范围做判断
设给定区域的经度范围为(lngmin,lngmax),纬度范围为(latmin,latmax);
将不满足lngminlongitudelngmax且latminlatitudelatmax的经纬度值全部置空,将满足上述条件的经纬度值存放在数组X中,X={x1,x2,…,xn},共计n组满足上述条件的经纬度值,xn为第n组满足上述条件的经纬度值;
(4)、建立孤立森林异常检测模型
(4.1)、建立单棵孤立树
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网四川省电力公司电力科学研究院;电子科技大学,未经国网四川省电力公司电力科学研究院;电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810190958.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





