[发明专利]异常检测模型训练方法、异常检测方法及装置在审
申请号: | 202110421423.0 | 申请日: | 2021-04-19 |
公开(公告)号: | CN113127858A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 张卉;杨洋 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F21/55 | 分类号: | G06F21/55;G06F16/955;G06K9/62 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 孙蕾 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 异常 检测 模型 训练 方法 装置 | ||
本公开提供了一种异常检测模型的训练方法,应用于人工智能领域、计算机技术领域或其它领域。异常检测模型的训练方法包括获取异常扫描报告;根据异常扫描报告获取异常数据集,其中,异常数据集中包括多个异常数据,异常数据用于表征异常扫描报告中的异常的参数信息;将异常数据集作为训练样本数据集,以训练待训练的初始异常检测模型,得到训练后的异常检测模型。本公开还提供了一种异常检测方法、异常检测模型的训练装置、异常检测装置、电子设备、计算机可读存储介质及计算机程序产品。
技术领域
本公开涉及人工智能领域和计算机技术领域,更具体地,涉及一种异常检测模型训练方法、异常检测方法、装置、电子设备、计算机可读存储介质及计算机程序产品。
背景技术
黑盒扫描是指在完全不知道应用程序内部结构和内部特征的情况下开展的扫描,普遍适用于对web应用(即网页应用)和手机应用的扫描。在对web应用和手机应用进行黑盒扫描时,利用黑盒扫描工具内置的攻击向量对应用的全量URL(Uniform ResourceLocator,统一资源定位符)进行攻击,并按照扫描工具预设的响应分类分析每个URL是否存在安全隐患,并生成扫描报告。
相关技术中通常用人工筛选的方式对扫描报告中报告的异常进行筛选,在实现本公开构思的过程中,发明人发现相关技术中存在人工筛选的成本较高且准确率较低的问题。
发明内容
有鉴于此,本公开提供了一种异常检测模型训练方法、异常检测方法及装置。
本公开的一个方面提供了一种异常检测模型训练方法,包括:
获取异常扫描报告;
根据上述异常扫描报告获取异常数据集,其中,上述异常数据集中包括多个异常数据,上述异常数据用于表征上述异常扫描报告中的异常的参数信息;
将上述异常数据集作为训练样本数据集,以训练待训练的初始异常检测模型,得到训练后的异常检测模型。
根据本公开的实施例,上述根据上述异常扫描报告获取异常数据集包括:
根据上述异常扫描报告获取多个原始异常数据;
对上述多个原始异常数据分别进行预处理,生成上述多个异常数据,其中,上述异常数据的数据类型包括数值型和/或布尔型;
根据上述多个异常数据生成上述异常数据集。
根据本公开的实施例,上述多个原始异常数据包括:请求数据和响应数据;
其中,上述请求数据包括原始请求数据和修改后的请求数据;上述响应数据包括与原始请求数据对应的响应数据和与修改后的请求数据对应的响应数据。
根据本公开的实施例,上述对上述多个原始异常数据分别进行预处理,生成上述多个异常数据包括:
对上述原始请求数据、与原始请求数据对应的响应数据、修改后的请求数据和与修改后的请求数据对应的响应数据分别进行特征提取,确定第一报文长度数据、第二报文长度数据、第三报文长度数据以及第四报文长度数据;
基于上述原始请求数据和上述修改后的请求数据,确定第一报文相似度;
基于上述与原始请求数据对应的响应数据和与上述修改后的请求数据对应的响应数据,确定第二报文相似度;
根据上述原始请求数据的报文体数据,确定上述原始请求数据的第一报文头的参数类型;
根据上述修改后的请求数据的报文体数据,确定上述修改后的请求数据的第二报文头的参数类型;
根据上述原始请求数据和上述与原始请求数据对应的响应数据,确定第一重现数据,其中,上述第一重现数据用于表征出现在上述原始请求数据中的关键字是否在上述与原始请求数据对应的响应数据中出现;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110421423.0/2.html,转载请声明来源钻瓜专利网。