[发明专利]基于流数据聚类算法的电力大数据流异常检测在审
申请号: | 201910529150.4 | 申请日: | 2019-06-19 |
公开(公告)号: | CN110222098A | 公开(公告)日: | 2019-09-10 |
发明(设计)人: | 齐林海;于小青;王红 | 申请(专利权)人: | 华北电力大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/28;G06K9/62;G06Q50/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 102206 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于电力大数据异常检测技术领域,公开了一种基于机器学习的流式K‑means聚类算法。本方法,首先通过Redis集群进行电力流数据的缓存及处理,然后使用基于最佳距离法的K‑means聚类算法从Redis集群中存取数据进行聚类分析。具体为:1)对电力大数据进行预处理,得到有效的训练样本和测试样本;2)使用Redis集群对样本数据进行在线缓存处理;3)使用K‑means算法进行数据的存取及聚类分析;4)使用测试样本,对模型的性能进行分析。本发明从数据的安全性、完整性以及流数据聚类算法的低时间复杂度的角度出发,改善了传统流数据聚类算法断电易丢失数据、不能存储全部数据等缺陷,使该算法能够应用于一些对数据敏感的应用。 | ||
搜索关键词: | 聚类算法 流数据 集群 聚类分析 大数据 算法 预处理 缓存 异常检测技术 时间复杂度 测试样本 存取数据 大数据流 丢失数据 基于机器 使用测试 训练样本 样本数据 异常检测 在线缓存 最佳距离 电力流 流式 断电 存取 样本 应用 存储 敏感 分析 学习 | ||
【主权项】:
1.一种基于流数据聚类算法的电力大数据流异常检测方法。其特征在于,该方法的具体步骤为:步骤1:对电力大数据进行数据归一化、划分训练集、测试集等预处理工作;步骤2:使用Redis集群对样本数据进行在线缓存;步骤3:使用K‑means聚类算法存取Redis中的数据进行离线聚类;步骤4:利用用户用电数据流进行算法的验证及性能分析;步骤5:对增量电力流式大数据进行与样本数据同样的预处理工作;步骤6:使用增量数据对保存的模型进行增量训练,验证模型的泛化能力。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北电力大学,未经华北电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910529150.4/,转载请声明来源钻瓜专利网。
- 上一篇:用于生成信息的方法和装置
- 下一篇:布线管理系统、设备及存储介质