[发明专利]一种自动化异常实体定位分析方法在审
申请号: | 201911019400.6 | 申请日: | 2019-10-24 |
公开(公告)号: | CN110837953A | 公开(公告)日: | 2020-02-25 |
发明(设计)人: | 刘大鹏;聂晓辉;朱晶;王耀 | 申请(专利权)人: | 北京必示科技有限公司 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q10/00;G06K9/62 |
代理公司: | 山东重诺律师事务所 37228 | 代理人: | 李常芳 |
地址: | 100000 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自动化 异常 实体 定位 分析 方法 | ||
1.一种自动化异常实体定位分析方法,其特征在于:该异常实体定位方法在业务指标发生异常时,触发定位系统进行分析;
该异常实体定位分析方法包括以下步骤:
S1、指标异常程度评判;
S2、相似异常实体聚类;
S3、定位结果排序。
2.根据权利要求1所述的一种自动化异常实体定位分析方法,其特征在于:所述步骤S1中,指标异常程度评判是指业务指标发生故障时,同时评判海量相关指标异常程度;
收集当前一段时间所有实体和模块的指标数据,并执行异常检测算法去检测所有指标的异常程度。
3.根据权利要求1所述的一种自动化异常实体定位分析方法,其特征在于:所述步骤S2中,相似异常实体聚类是指将具有类似异常业务指标的实体进行聚类;
得到所有的指标的异常程度后,通过聚类算法将具有类似指标异常的实体进行聚类。
4.根据权利要求1所述的一种自动化异常实体定位分析方法,其特征在于:所述步骤S3中,定位结果排名是指对得到的多种不同结果根据异常程度进行排名;
通过运行智能排序算法,将所有的聚类结果按照异常程度排名,并最终展示给运维人员。
5.根据权利要求2所述的一种自动化异常实体定位分析方法,其特征在于:所述指标异常程度评判的目的是使用异常检测算法检测出指标时间序列曲线的异常模式;
所述指标异常程度评判是将异常检测问题转换成统计上的概率观测模型,观测曲线发生突变的概率,利用异常检测算法来给出曲线的异常程度;
设定故障发生在时间t1,针对单个指标,算法收集故障发生前[t-w1,t)的数据集合{xi}和故障发生后[t,t+w2)的数据集合{xj};
将异常检测问题转换成给定观测的数据集合{xi}和{xj}的观测概率P({xi}|{xj})的计算问题,最终针对每个指标,利用异常检测算法计算出其突增的概率Po({xj}|{xi})和突降的概率Pu({xj}|{xi}),用于描述当前指标的异常程度;
异常检测算法如下:
其中,o和u代表突增和突降的异常程度,m代表{xj}的大小。
6.根据权利要求3所述的一种自动化异常实体定位分析方法,其特征在于:相似异常实体聚类算法的核心是将每台实体的异常指标信息做成一个向量,设计合适的聚类算法做实体的聚类;
所述聚类算法主要包括三个部分:输入向量、距离函数和聚类算法;
设定所述输入向量为(o0,u0,o2,u2,...,on,un),其中,on和un分别代表第n个KPI指标的突增和突降的异常程度;
所述距离函数用于计算两个向量的聚类;
聚类算法用于度量两个变量X’和Y’之间的相关,其值介于-1与1之间,为两个变量之间的协方差和标准差的商;
计算算法为:
上式定义了总体相关系数,计算样本的协方差和标准差,可以得到样本相关系数,用r表示,计算公式如下:
r值为1意味着X’和Y’正相关,且Y’随着X’的增加而增加,r的值为-1意味着X’和Y’负相关,且Y’随着X’的增加而减少,r的值为0时意味着两个变量之间没有线性关系,因此,本算法的距离函数如下:
Distance=1-r;
聚类算法将具有足够密度的区域划分为簇,在具有噪声的空间数据库中发现任意形状的簇,将簇定义为密度相连的点的最大集合。
7.根据权利要求4所述的一种自动化异常实体定位分析方法,其特征在于:所述定位结果排序利用聚类算法得到不同表征的实体,将不同类别的实体指标作出排序,利用监督学习的逻辑回归方法,通过学习部分人工标注的结果,训练出合适的排序模型Y1=f(X1);
其中,X1为特征部分,Y1为排序的分数;
该算法采用的特征定义如下:
(1)最大异常值:所有KPI中异常程度最大的值;
(2)异常值总和:所有KPI的异常程度值的加和;
(3)异常KPI数目:通缉异常程度高于异常阈值的KPI数量;
(4)实体数目占比:异常实体数据个数除以当前模块实体的数目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京必示科技有限公司,未经北京必示科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911019400.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于时空卷积神经网络的图像字符识别方法
- 下一篇:一种冲压型金属铸造模具
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理