[发明专利]一种基于生成器的异常检测方法在审
| 申请号: | 202110036714.8 | 申请日: | 2021-01-12 |
| 公开(公告)号: | CN112766459A | 公开(公告)日: | 2021-05-07 |
| 发明(设计)人: | 宋艳枝;罗翌新 | 申请(专利权)人: | 合肥黎曼信息科技有限公司 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06F17/18;G06K9/62 |
| 代理公司: | 安徽省蚌埠博源专利商标事务所(普通合伙) 34113 | 代理人: | 朱恒兰 |
| 地址: | 230001 安徽省合肥市高新区创新*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 生成器 异常 检测 方法 | ||
本发明涉及异常检测算法领域,具体涉及一种基于生成器的异常检测方法,包括神经网络架构训练异常检测模型,其特征在于:所述的神经网络架构训练异常检测模型包括编码器、生成器、判别器,所述的编码器为从数据空间到特征向量空间的编码器,在所述的编码器后置一个正则化层用以规范化特征向量的取值范围,所述的生成器与所述的编码器连接,所述的判别器添加于所述的生成器后,用以拟合分布度量;这种基于生成器的异常检测方法,实现同时利用特征向量以及正常数据流形分布的异常检测。
技术领域
本发明涉及异常检测算法领域,具体涉及一种基于生成器的异常检测方法。
背景技术
异常检测问题,是一类在仅有某个类别的样本(也被称为正常样本)可用的情况下,如何通过训练一个机器学习模型或者使用一族相关指标,能够在未知类别的测试样本集中找到不同于正常样本的样本(也称为异常样本)的问题。
传统的用于解决异常检测问题的算法,一般有两种:一种是通过将样本通过某种变换(例如对于图像数据的几何算子变换或卷积神经网络,对于向量数据的傅立叶变换等)被映射成特征向量,然后在特征向量空间内找到正常样本的边界,并依此设计分数函数来确定测试样本是否属于边界内样本;一种是通过无监督学习的方式(例如Auto-encoders,GANs)找到正常样本在数据空间域的流形分布,并设计距离函数度量测试样本和这个流形质检的差异。上述两大类方法各自在不同的领域取得了较好的效果,但如何将这两者有机地结合起来,从而获取对于异常检测问题更好的算法,是我们需要考虑的问题。
发明内容
本发明的目的是提供一种基于生成器的异常检测方法,实现同时利用特征向量以及正常数据流形分布的异常检测。
为了实现以上目的,本发明采用的技术方案为:一种基于生成器的异常检测方法,包括神经网络架构训练异常检测模型,其特征在于:所述的神经网络架构训练异常检测模型包括编码器、生成器、判别器,所述的编码器为从数据空间到特征向量空间的编码器,在所述的编码器后置一个正则化层用以规范化特征向量的取值范围,所述的生成器与所述的编码器连接,所述的判别器添加于所述的生成器后,用以拟合分布度量。
进一步的,所述的方法还包括以下步骤:
S1:统计正常样本在重构误差上的分布直方图,得到测试样本的对应累积概率密度Cr;
S2:统计训练样本对应的特征向量到所有特征向量中心(即求均值)之间的距离分布直方图,得到测试样本对应特征向量在特征向量空间中与中心距离的累积概率密度Cd;
S3:对所述的测试样本的对应累积概率密度Cr和测试样本对应特征向量在特征向量空间中与中心距离的累积概率密度Cd取log并相加得到测试样本的正常程度。
本发明的技术效果在于:这种基于生成器的异常检测方法基于自动编码器和对抗生成网络同时优化重构误差以及获取正常样本的流形分布,并通过设计同时考虑特征向量空间和数据空间的分数用以判别测试样本的正常程度的方法,具有训练快、精度高、效果好的特点。
附图说明
图1为本发明实施例提供的异常检测算法的训练及测试流程示意图。
图2为本发明实施例提供的异常检测算法对分数函数设计的思路示意图。
图3为本发明实施例提供的异常检测算法在MNIST,CIFAR10上的检测效果示意图。
图4为本发明实施例提供的异常检测算法在CIFAR10上和使用重构误差方法的对比示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥黎曼信息科技有限公司,未经合肥黎曼信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110036714.8/2.html,转载请声明来源钻瓜专利网。





