[发明专利]一种变点检测优化方法、系统及装置在审
申请号: | 202110616615.7 | 申请日: | 2021-06-02 |
公开(公告)号: | CN113378365A | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 朱鸿斌;徐维超;谭华;王天乐;王柏鸿;陈泽鹏;宋卓霖;王彦光 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F30/20 | 分类号: | G06F30/20;G06K9/00 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510090 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 检测 优化 方法 系统 装置 | ||
1.一种变点检测优化方法,其特征在于,所述方法至少包括:
S1.设置第一检测窗口与第二检测窗口的长度;
S2.滑动第一检测窗口与第二检测窗口,分别获取待测数据序列,所述第一检测窗口获取的数据定义为正类数据,第二检测窗口获取的数据定义为负类数据;
S3.利用动态规划法计算正类数据与负类数据的AUC统计量,获得AUC序列;
S4.利用指数加权移动平均法对AUC序列进行光滑处理;
S5.通过零假设实验,获得AUC密度分布图,设置置信度,再根据相应的置信度及累积分布图求取相应的阈值,以检测潜在突变点;
S6.设置K值,利用K值法进一步确认真实突变点,筛除虚假变点;
S7.输出待测数据序列的突变点个数及位置。
2.根据权利要求1所述的变点检测优化方法,其特征在于,令Q={q1,q2,..,qt}为待测数据序列,序列中的元素独立同分布于F(μ,δ2),其中,μ,δ2分别为Q的均值和方差,当序列发生均值时,其数学模型表述如下:
qi~F(μ+Δμ,δ2)τ+1≤i≤N,
所述第一检测窗口与第二检测窗口为连续的、且大小一致的检测窗口。
3.根据权利要求2所述的变点检测优化方法,其特征在于,步骤S3所述利用动态规划法计算正类数据与负类数据的AUC统计量的具体过程为:
S31.设正类数据表示为负类数据表示为将正类数据与负类数据汇总为序列对进行排序,得到z1<z2<…<zm+n;其中,m表示正类数据的个数,n表示负类数据的个数;
S32.获取正类数据和负类数据在序列z1<z2<…<zm+n中对应的位置及数量,表达式分别为Mx=[a1,a2,...,ak]、My=[b1,b2,...,bk],其中,al表示xi等于zk的个数以及在序列zk中相应的位置,bl表示yj等于zk的个数以及在序列zk中相应的位置;
S33.使用cumsum函数进行加乘计算,公式为:
其中,H为指示函数,当xi<yj时,H为1,否则为0;上式计算规则满足:
S34.将步骤S33的计算结果除以正、负类数据数量的乘积,得到AUC统计量,表达式为:
4.根据权利要求3所述的变点检测优化方法,其特征在于,步骤S4所述利用指数加权移动平均法对AUC序列进行光滑处理的表达式为:
其中,θt表示到第t时刻AUC的平均值,表示第t时刻的AUC值,α为可调参数。
5.根据权利要求4所述的变点检测优化方法,其特征在于,步骤S5所述的零假设实验指无突变点序列的情况下,进行重复随机试验;
步骤S5所述的具体过程为:
S51.设定随机试验重复次数上限;
S52.根据检测窗口的大小,随机产生两类来自同一分布的数据,分别为正类数据与负类数据;
S53.计算两类数据的AUC值;
S54.判断随机试验重复次数是否达到上限,若是,执行步骤S55;否则,执行返回步骤S51;
S55.画出AUC对应的密度分布图及累积分布图,设置置信度,根据相应的置信度及累积分布图,计算获得相应的阈值。
6.根据权利要求5所述的变点检测优化方法,其特征在于,步骤S55所述的置信度为95%。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110616615.7/1.html,转载请声明来源钻瓜专利网。