[发明专利]滑动窗分段直线表示法的总拟合误差阈值估计方法与系统有效
申请号: | 201810399883.6 | 申请日: | 2018-04-28 |
公开(公告)号: | CN108615017B | 公开(公告)日: | 2019-04-02 |
发明(设计)人: | 王建东;陈矿 | 申请(专利权)人: | 山东科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李圣梅 |
地址: | 266590 山东省青*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 滑动窗 拟合误差 分段 典型数据 分段直线 时间尺度 训练数据 阈值估计 表示法 残差 拟合 历史时间序列数据 报警系统 方法实施 分布计算 辅助操作 工作效率 过程监控 快速确定 趋势变化 时间序列 数据分段 统计性质 噪声水平 阈值计算 有效地 直线段 采集 | ||
1.滑动窗分段直线表示法的总拟合误差阈值估计方法,其特征是,为离线训练步骤,所述离线训练步骤中,具体包括:
选取工业报警系统中采集到的一段历史时间序列数据作为训练数据;
选取典型数据趋势时间尺度,该典型数据趋势时间尺度指的是描述时间序列变化趋势所需的样本量的时长平均值;
由训练数据的统计性质估计拟合残差的分布,根据拟合残差的分布计算滑动窗分段方法对应的总拟合误差阈值,所确定的总拟合误差的阈值,应使得实施滑动窗分段方法后的直线段平均时间长度等于典型数据趋势时间尺度;
所述由训练数据的统计性质估计拟合残差的分布,具体为:
将训练数据时间序列进行分段线性表示,包含N段直线段,长度分别为L1,L2,L,LN,继而获得任意的第n个直线段Sn的表达式;
设直线段Sn的拟合直线,选取拟合直线的任意两个数据点及该直线段上的对应点,获得两组数据的残差;
假设残差满足均值为零的高斯分布,计算残差的方差的估计值;
训练数据时间序列表示为:x(1:t)=[x(1),x(2),…,x(t)]′;
训练数据时间序列的分段线性表示为另一时间序列包含N段直线段,长度分别为L1,L2,…,LN,且有
任意的第n个直线段Sn表示为
令残差该段的总拟合误差为
总拟合误差的阈值η满足根据该准则,合适的阈值η使得各直线段的长度均值接近于典型数据趋势时间尺度T,即
2.如权利要求1所述的滑动窗分段直线表示法的总拟合误差阈值估计方法,其特征是,利用上述滑动窗分段直线表示法的总拟合误差阈值估计方法所得到的总拟合误差阈值用于在线实施时间序列数据的滑动窗分段。
3.如权利要求1所述的滑动窗分段直线表示法的总拟合误差阈值估计方法,其特征是,
设直线段Sn的拟合直线为x=an+bn·t,选取任意两个数据点x(t1)和x(t2)及该直线段上的对应点和则有an是拟合直线的截距,
残差为做差得到
有
两边平方后取期望,得
假设残差满足均值为零的高斯分布,即e~N(0,σ2),其中σ2为方差;
令Δx=x(t2)-x(t1)及Δt=t2-t1,上式简化为
考虑Δt=1的情况,上式中用的样本均值估计为
而估计如下,由于且e~N(0,σ2),则
因而
由(5)(6)(8)得到残差的方差的估计值
4.如权利要求1所述的滑动窗分段直线表示法的总拟合误差阈值估计方法,其特征是,所述根据拟合残差的分布计算滑动窗分段方法对应的总拟合误差阈值中,对于滑动窗分段方法,总拟合误差的阈值η满足如下关系:
5.如权利要求4所述的滑动窗分段直线表示法的总拟合误差阈值估计方法,其特征是,令由e~N(0,σ2),则s满足卡方分布,即
s~χ2(Ln-1) (11)
又则直线段Sn长度为Ln的概率为
其中,f(x,k)是关于x的k自由度卡方分布的概率密度函数,根据准则:所确定的总拟合误差的阈值,应使得实施滑动窗分段方法后的直线段平均时间长度等于典型数据趋势时间尺度,应有
将(12)式代入(13),并使用数值解法求解关于η的方程,得到所要求的总拟合误差的阈值η。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东科技大学,未经山东科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810399883.6/1.html,转载请声明来源钻瓜专利网。