[发明专利]基于SparkStreaming的电力系统日志数据实时处理方法有效
| 申请号: | 201710951969.0 | 申请日: | 2017-10-13 |
| 公开(公告)号: | CN107704594B | 公开(公告)日: | 2021-02-09 |
| 发明(设计)人: | 宋爱波;涂金林 | 申请(专利权)人: | 东南大学 |
| 主分类号: | G06F16/2453 | 分类号: | G06F16/2453;G06F16/242;G06F16/2455 |
| 代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210096 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 sparkstreaming 电力系统 日志 数据 实时处理 方法 | ||
1.一种基于Spark Streaming的电力系统日志数据实时处理方法,其特征在于:包括以下步骤:
(1)定义不同日志类别的统计模型,统计模型包括元素:数据集、结果集、分组条件、分组过滤器和规则动作;
(2)构建Spark Streaming块间隔与数据流处理时间的关系模型,将数据流划分成若干数据块的时间,即块间隔;若干数据块组合成一个批次的时间,即批间隔;
(3)给定批间隔,利用贪心算法,动态调整块间隔,探寻最优块间隔;
所述贪心算法步骤为:
(3.1)初始块间隔表示为β,调整步长为i;
(3.2)如果块间隔为β的批处理时间小于块间隔为β+i的批处理时间,则最优的块间隔在初始块间隔的左侧;如果块间隔为β的批处理时间小于块间隔为β-i的批处理时间,则最优的块间隔在初始块间隔的右侧;
(3.3)当探寻到最优块间隔的方向,继续循环探索,直到处理时间不能再次减小。
2.根据权利要求1所述的基于Spark Streaming的电力系统日志数据实时处理方法,其特征在于:所述步骤(2)中关系模型构建步骤:
(2.1)分批模块将接收的数据流根据块间隔划分成独立的数据块;
(2.2)将一个批间隔时间内的数据块包裹成一个批次,进入批队列中排队等待被处理;
(2.3)一个批间隔时间内的所有块间隔的数据并行处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710951969.0/1.html,转载请声明来源钻瓜专利网。





