[发明专利]一种网页后门检测方法和装置、计算机可读存储介质在审
申请号: | 201811418384.3 | 申请日: | 2018-11-26 |
公开(公告)号: | CN109657467A | 公开(公告)日: | 2019-04-19 |
发明(设计)人: | 虎志强 | 申请(专利权)人: | 北京兰云科技有限公司 |
主分类号: | G06F21/56 | 分类号: | G06F21/56;G06K9/62 |
代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 陶丽;李丹 |
地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征向量 网页脚本 检测 后门 网页 计算机可读存储介质 随机森林分类器 方法和装置 长字符串 特征向量提取 字符串数组 脚本文件 数组元素 注释信息 信息熵 字符串 拼接 去除 申请 | ||
本申请公开了一种网页后门检测方法和装置、计算机可读存储介质,所述网页后门检测方法包括:获取网页脚本文件,去除网页脚本文件中的注释信息;提取网页脚本文件的特征向量,所述特征向量包括文件中的各字符串数组的数组元素拼接所得的字符串中最长字符串的长度及所述最长字符串的信息熵;使用预先训练好的随机森林分类器模型对提取的特征向量进行检测,以确定所述网页脚本文件是否为网页后门Webshell文件。本申请通过对文件进行特征向量提取,并通过随机森林分类器模型对提取的特征向量进行检测,能够提高对Webshell脚本文件的检测能力,提高Web服务器的安全性。
技术领域
本发明涉及网络安全检测技术领域,尤其涉及一种网页后门检测方法和 装置、计算机可读存储介质。
背景技术
Webshell是以asp、php、jsp、aspx等网页脚本文件形式存在的一种命令 执行环境,也叫做网页后门。黑客可以利用Webshell来获取服务器的访问权 限,并借助服务器来执行任意的系统命令、对系统上的文件进行增删改查、 植入恶意软件或者进一步攻击内网等操作。因此,为了维护网站(Web)服 务器的安全性,有必要对Webshell进行检测。
现有的Webshell检测技术,通常通过提取脚本文件中的特征代码,通过 特征代码匹配的方式进行检测,这种检测方法只能检测已知威胁,对未知威 胁的检测能力较差,如果黑客对Webshell脚本文件进行混淆、加密处理,将 很难进行有效的检测。
发明内容
本发明实施例提供了一种网页后门检测方法和装置、计算机可读存储介 质,能够提高Webshell检测的准确率。
本发明实施例的技术方案是这样实现的:
本发明实施例提供了一种网页后门检测方法,包括:
获取网页脚本文件,去除网页脚本文件中的注释信息;
提取网页脚本文件的特征向量,所述特征向量包括文件中的各字符串数 组的数组元素拼接所得的字符串中最长字符串的长度及所述最长字符串的信 息熵;
使用预先训练好的随机森林分类器模型对提取的特征向量进行检测,以 确定所述网页脚本文件是否为网页后门Webshell文件。
在一实施例中,所述特征向量还包括以下至少之一:
所述文件的信息熵、所述字符串变量长度的均值、所述字符串变量长度 的方差、所述文件长度、所述最大字符串变量长度、所述最大字符串的信息 熵、所述文件中敏感函数的频率、所述文件中匹配的特征代码段个数。
在一实施例中,所述方法之前还包括:
获取网页脚本文件样本,提取所述网页脚本文件样本中的特征向量,将 提取的特征向量划分为原始训练集和原始测试集;
使用所述原始训练集和随机森林算法训练所述随机森林分类器模型;
使用所述原始测试集对训练好的所述分类器模型进行验证,并根据预设 的评估指标,对所述随机森林分类器模型进行参数调整。
在一实施例中,所述使用所述原始训练集和随机森林算法训练所述随机 森林分类器模型,包括:
从所述原始训练集中进行k轮随机有放回采样,得到k个训练集,每个 训练集包括n个所述训练样本,k和n均为自然数;
对k个训练集,根据训练集中的训练样本以及所述训练样本的特征向量 选择分裂属性,依据分裂属性对训练集进行训练生成决策树;
将生成的多棵决策树组成所述随机森林分类器。
在一实施例中,所述决策树为分类回归树CART决策树;生成所述决策 树时,根据基尼指数选择分裂点进行分裂。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京兰云科技有限公司,未经北京兰云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811418384.3/2.html,转载请声明来源钻瓜专利网。