[发明专利]一种基于算法多样性的异常检测算法集成方法及系统在审
申请号: | 201911406458.6 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111159508A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 梁淑云;刘胜;马影;陶景龙;王启凡;魏国富;徐明;殷钱安;余贤喆;周晓勇 | 申请(专利权)人: | 上海观安信息技术股份有限公司 |
主分类号: | G06F16/906 | 分类号: | G06F16/906 |
代理公司: | 合肥市浩智运专利代理事务所(普通合伙) 34124 | 代理人: | 张景云 |
地址: | 200333 上海市浦东新*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 算法 多样性 异常 检测 集成 方法 系统 | ||
1.一种基于算法多样性的异常检测算法集成方法,其特征在于,包括以下方法:
S01.使用多个异常检测算法建立多个基础训练器,分别对样本集进行预测,并对预测结果进行处理生成伪标签;
S02.针对每个基础训练器,计算其预测结果与伪标签的相关系数;
S03.对所有异常检测算法进行分类;
S04.对每个分类,选取相关系数最高且高于设定阈值的TOPN算法,建立算法组合;
S05.使用算法组合进行异常检测,输出异常点。
2.根据权利要求1所述的一种基于算法多样性的异常检测算法集成方法,其特征在于,所述步骤S01中,将多种异常检测算法预测结果的函数汇总作为伪标签;汇总函数为取均值或取最大值或取最大值的均值或取均值的最大值。
3.根据权利要求1所述的一种基于算法多样性的异常检测算法集成方法,其特征在于,所述步骤S03中,对所有异常检测算法进行分类的原则为:根据算法的实现机制进行分类。
4.根据权利要求1所述的一种基于算法多样性的异常检测算法集成方法,其特征在于,所述步骤S04中,选取相关系数最高且高于设定阈值的TOPN算法具体方法为:
1)确定相关系数阈值和相关系数排名阈值;
2)初始化算法组合列表,生成空列表;
3)构建算法字典,所述算法字典内包括所有算法分类;
4)然循环遍历算法字典的算法分类,循环遍历某一算法分类里的算法,如果该算法的相关系数≥相关系数阈值且该算法的相关系数排名<相关系数排名阈值,则将该算法加入算法组合列表。
5.一种基于算法多样性的异常检测算法集成系统,其特征在于,包括
伪标签生成模块,用于使用多个异常检测算法建立多个基础训练器,分别对样本集进行预测,并对预测结果进行处理生成伪标签;
相关系数计算模块,用于对每个基础训练器,计算其预测结果与伪标签的相关系数;
算法分类模块,提供人机接口,用于对基础训练器使用的算法进行分类;
算法选择模块,用于对每个分类选取相关系数最高且高于设定阈值的TOPN算法,建立算法组合;
异常预测模块,用于使用算法组合进行异常检测,输出异常点。
6.根据权利要求5所述的一种基于算法多样性的异常检测算法集成系统,其特征在于,所述伪标签生成模块中,将多种异常检测算法预测结果的函数汇总作为伪标签;汇总函数为取均值或取最大值或取最大值的均值或取均值的最大值。
7.根据权利要求5所述的一种基于算法多样性的异常检测算法集成方法,其特征在于,所述算法分类模块中,对所有异常检测算法进行分类的原则为:根据算法的实现机制进行分类。
8.根据权利要求5所述的一种基于算法多样性的异常检测算法集成方法,其特征在于,所述算法选择模块中,选取相关系数最高且高于设定阈值的TOPN算法具体方法为:
1)确定相关系数阈值和相关系数排名阈值;
2)初始化算法组合列表,生成空列表;
3)构建算法字典,所述算法字典内包括所有算法分类;
4)然循环遍历算法字典的算法分类,循环遍历某一算法分类里的算法,如果该算法的相关系数≥相关系数阈值且该算法的相关系数排名<相关系数排名阈值,则将该算法加入算法组合列表。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海观安信息技术股份有限公司,未经上海观安信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911406458.6/1.html,转载请声明来源钻瓜专利网。