[发明专利]一种环境数据修复/填充方法及系统有效
| 申请号: | 202010453726.6 | 申请日: | 2020-05-26 |
| 公开(公告)号: | CN111625525B | 公开(公告)日: | 2023-05-26 |
| 发明(设计)人: | 赵泽明;刘京;靳崇渝;薛普宁;周志刚 | 申请(专利权)人: | 哈尔滨工业大学 |
| 主分类号: | G06F16/215 | 分类号: | G06F16/215 |
| 代理公司: | 北京高沃律师事务所 11569 | 代理人: | 杜阳阳 |
| 地址: | 150006 黑龙*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 环境 数据 修复 填充 方法 系统 | ||
1.一种环境数据修复/填充方法,其特征在于,所述方法包括:
获取不同时刻的室内外环境数据;所述室内外环境数据包括多个属性的环境数据;
基于ORIGIN软件,绘制不同属性的室内外环境数据的箱形图;
根据所述箱形图确定异常数据组;所述异常数据组表示不同时刻的室内外环境数据中的异常数据;
采用忽略元组法,将所述异常数据组中的连续异常或缺失的多属性数据删除,得到处理后的异常数据组;所述连续异常或缺失的多属性数据为连续异常或缺失时间超过第一预设时间的多于1个属性的数据;
采用距离加权的KNN算法,对连续异常或缺失的单一属性数据进行修复或填充;所述连续异常或缺失的单一属性数据为连续异常或缺失时间超过第一预设时间,但不超过第二预设时间的单一属性数据;
对处理后的异常数据组进行分段;
采用改进的指数加权滑动平均模型,对分段后的异常数据组中的非连续异常或缺失的数据进行修复或填充;
整合修复或填充好的数据;
其中,所述采用距离加权的KNN算法,对连续异常或缺失的单一属性数据进行修复或填充,具体包括:
计算所述连续异常或缺失的单一属性数据与完好数据之间的欧氏距离;
筛选出与所述连续异常或缺失的单一属性数据之间的欧式距离最近的完好数据;
根据筛选出的完好数据的属性值进行修复和填充;
其中,所述采用改进的指数加权滑动平均模型,对分段后的异常数据组中的非连续异常或缺失的数据进行修复或填充,具体包括:
根据所述非连续异常或缺失的数据创建时序集合;
根据所述时序集合中各室内外环境数据与所述非连续异常或缺失的数据之间时间距离,对所述时序集合中各室内外环境数据进行赋权;
根据权重平均值进行修复或填充。
2.根据权利要求1所述的环境数据修复/填充方法,其特征在于,所述根据所述箱形图确定异常数据组,具体包括:
判断室内外环境数据是否超出所述箱形图的上边缘和下边缘;
若是,则确定所述室内外环境数据为异常数据。
3.一种环境数据修复/填充系统,其特征在于,所述系统包括:
数据获取模块,用于获取不同时刻的室内外环境数据;所述室内外环境数据包括多个属性的环境数据;
绘制模块,用于基于ORIGIN软件,绘制不同属性的室内外环境数据的箱形图;
异常数据组确定模块,用于根据所述箱形图确定异常数据组;所述异常数据组表示不同时刻的室内外环境数据中的异常数据;
删除模块,用于采用忽略元组法,将所述异常数据组中的连续异常或缺失的多属性数据删除,得到处理后的异常数据组;所述连续异常或缺失的多属性数据为连续异常或缺失时间超过第一预设时间的多于1个属性的数据;
第一修复/填充模块,用于采用距离加权的KNN算法,对连续异常或缺失的单一属性数据进行修复或填充;所述连续异常或缺失的单一属性数据为连续异常或缺失时间超过第一预设时间,但不超过第二预设时间的单一属性数据;
分段模块,用于对处理后的异常数据组进行分段;
第二修复/填充模块,用于采用改进的指数加权滑动平均模型,对分段后的异常数据组中的非连续异常或缺失的数据进行修复或填充;
整合模块,用于整合修复或填充好的数据;
所述第一修复/填充模块具体包括:
计算单元,用于计算所述连续异常或缺失的单一属性数据与完好数据之间的欧氏距离;
筛选单元,用于筛选出与所述连续异常或缺失的单一属性数据之间的欧式距离最近的完好数据;
第一修复/填充单元,用于根据筛选出的完好数据的属性值进行修复或填充;
所述第二修复/填充模块具体包括:
创建单元,用于根据所述非连续异常或缺失的数据创建时序集合;
赋权单元,用于根据所述时序集合中各室内外环境数据与所述非连续异常或缺失的数据之间时间距离,对所述时序集合中各室内外环境数据进行赋权;
第二修复/填充单元,用于根据权重平均值进行修复或填充。
4.根据权利要求3所述的环境数据修复/填充系统,其特征在于,所述异常数据组确定模块具体包括:
判断单元,用于判断室内外环境数据是否超出所述箱形图的上边缘和下边缘;
确定单元,用于当室内外环境数据超出所述箱形图的上边缘和下边缘时,确定所述室内外环境数据为异常数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学,未经哈尔滨工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010453726.6/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





