[发明专利]一种基于四分位箱线图的风机异常数据处理方法及装置在审

专利信息
申请号: 201710001788.1 申请日: 2017-01-03
公开(公告)号: CN106897941A 公开(公告)日: 2017-06-27
发明(设计)人: 向婕;雍正;王德民 申请(专利权)人: 北京国能日新系统控制技术有限公司
主分类号: G06Q50/06 分类号: G06Q50/06
代理公司: 天津滨海科纬知识产权代理有限公司12211 代理人: 李成运
地址: 100081 北京市海淀*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 四分位箱 线图 风机 异常 数据处理 方法 装置
【说明书】:

技术领域

发明属于风电领域,特别是涉及到一种基于四分位箱线图的风机异常数据处理方法及装置。

背景技术

随着新能源的快速发展,风电并网容量快速增加,在对风电场运行数据的处理中,对风机出力数据的处理尤其重要,但是长期以来绝大部分的数据处理都是靠人工经验进行处理,缺乏一个系统的依据统计基础的数据处理方法。

现有对风机的数据处理方法为依据风机机头风速和风机出力拟合出一条统计拟合曲线,在此曲线的基础上,依据经验人为制定上下置信区间,依据此区间进行数据处理。

现存方法存在以下缺陷:

(1)拟合出的曲线并不能完全代表风机的数据的分布规律,拟合存在一定偏差,对后续的进一步处理产生误导;

(2)人为制定的上下限区间只是根据历史经验而定,缺乏一定的科学依据;往往造成正确数据的错处理和异常数据的漏处理,处理后的数据相对生硬,并对数据增添了人为因素,对后续的数据分析造成一定影响。

(3)统计拟合判断异常值的标准是以计算数据的均值和标准差为基础的,而均值和标准差的耐抗性极小,异常值本身会对它们产生较大影响,这样产生的异常值个数不会多于总数0.7%;用这种方法于非正态分布数据中判断异常值,其有效性是有限的。

在对大量风机数据的处理中,异常值值得关注,忽视异常值的存在是十分危险的,在对数据的计算分析过程中,如果不考虑对异常值的处理,会对结果会带来不良影响;重视异常值的出现,分析其产生的原因,常常成为发现问题进而改进决策的契机。

发明内容

基于四分位数(Quartile)的箱线图(Box-plot),在统计学中常用来分析判断数据的分布特征,基于四分位数的箱形图为我们提供了识别异常值的一个标准:异常值被定义为小于Q1-1.5IQR或大于Q3+1.5IQR的值。与识别异常值的经典方法不同,箱形图的绘制依靠实际数据,不需要事先假定数据服从某种特定的分布形式,没有对数据作任何限制性要求,它只是真实直观地表现数据形状的本来面貌;另一方面,箱形图判断异常值的标准以四分位数和四分位距为基础,四分位数具有一定的耐抗性,多达25%的数据可以变得任意远而不会很大地扰动四分位数,所以异常值不能对这个标准施加影响,箱形图识别异常值的结果比较客观。

基于上述内容,本发明提出一种基于四分位箱线图的风机异常数据处理方法及装置,利用四分位箱线图对风机数据进行异常值检验处理,在识别风机数据异常值方面具有优越性。

为达到上述目的,本发明的技术方案是这样实现的,一种基于四分位箱线图的风机异常数据处理方法,包括:

(1)按照一定格式读取风机数据;

(2)剔除风机数据连续重复值;

(3)利用四分位法判断处理风机功率异常值;

(4)利用四分位法判断处理风机风速异常值。

进一步的,步骤(1)所述数据读取的方法为:按照一定格式读取风机机头数据,主要包括时间、机头风速和机头功率,所述格式为按时间进行排序,设定风速间隔频率、功率间隔频率、最大风速值及机头最大功率值。

进一步的,步骤(2)所述剔除连续重复值的方法为:

(201)设定连续重复次数阈值K,并对数据按时间进行排序,初始每个数据点标签值Lable为1,行标签值RcLable为1;

(202)依次遍历风机数据,判断当前时刻与上一时刻是否相等,相等则标签值Lable加1;

(203)判断标签值Lable与阈值K,将Lable≥K时对应的数值及其前K个值的行标签RcLable置为0;

(204)剔除行标签值为0的相应风机数据;

(205)将处理后的数据存入新的变量,以备下一步进行功率异常值的处理。

进一步的,步骤(3)的具体方法为:

(301)读取处理重复值后的数据,并将数据按照风机功率进行排序;

(302)按照步骤(1)中设置的风速间隔频率读取风速段,并读取对应该风速段内的风机数据,利用四分位法找出该数据段内功率的第一四分位数,即处于25%时刻的数值p1;和第三四分位数,即处于75%时刻的数值p3;以及四分位距dp=p3-p1;将功率值在[p1-n*dp,p3+n*dp]之外的数据判定为异常值,其中n可调;

(303)将处理后的数据存入新的数值变量中,以备下一步进行风速异常值的处理。

进一步的,步骤(4)的具体方法为:

(401)读取风机功率异常值处理后的数据,并将数据按照风机风速进行排序;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京国能日新系统控制技术有限公司,未经北京国能日新系统控制技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710001788.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top