[发明专利]一种基于RNN的Webshell检测方法及装置有效

专利信息
申请号: 202010809947.2 申请日: 2020-08-13
公开(公告)号: CN112118225B 公开(公告)日: 2021-09-03
发明(设计)人: 张秀华 申请(专利权)人: 紫光云(南京)数字技术有限公司
主分类号: H04L29/06 分类号: H04L29/06;G06F16/35;G06F40/284;G06F40/289;G06N3/04;G06N3/08
代理公司: 南京中盟科创知识产权代理事务所(特殊普通合伙) 32279 代理人: 孙丽君
地址: 210000 江苏省南京市浦口区江浦街*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 rnn webshell 检测 方法 装置
【说明书】:

发明公开了一种基于RNN的Webshell检测方法及装置,所述方法包括以下步骤:S1、通过预设方法对源文件进行预处理,获取关键词;S2、采用预设法则构建门控循环单元GRU模型,并进行训练;S3、通过所述门控循环单元GRU模型对所述源文件进行判别。有益效果:本发明从关键词集来近似样本的角度,通过提取关键词,使用样本对应的关键词集来近似表示样本,有效地排除了样本中的无用噪声,相比于传统常用的机器学习算法,本发明能够提取深层次的特征,从而不仅有效地提高了检测的准确率,而且还有效地降低了误报率和漏报率,进而使得本发明能够更加有效地实现对webshell的检测。

技术领域

本发明涉及互联网技术领域,具体来说,涉及一种基于RNN的Webshell检测方法及装置。

背景技术

WebShell就是以asp、php、jsp或者cgi等网页文件形式存在的一种命令执行环境,也可以将其称之为一种网页后门。攻击者在入侵了一个网站后,通常会将这些asp或php后门文件与网站服务器web目录下正常的网页文件混在一起,然后使用浏览器来访问这些后门,得到一个命令执行环境,以达到控制网站服务器的目的,这就是webshell文件上传攻击。

Webshell可分为2类,一类是小马,一类是大马。小马,源文件代码量较少,通常是几行到几十行不等,其功能主要是文件上传、执行命令行程序等。大马,文件大小少则几KB,多则几百KB,甚至超过1MB,功能复杂,包括执行命令行程序、上传文件、权限提升、端口扫描、数据库操作等。此外,大马要完成其功能还需要其他源文件的配合,协同作战,达到攻击目的。

当前防范webshell文件上传攻击常见的检测方法有以下几种:1)、将文件上传的目录设置为不可执行;2)、判断文件类型,结合白名单的方式进行访问控制;3)、使用随机数改写文件名和文件类型,增加攻击成本;4)、单独设置文件服务器的域名。其中第二种方法即判断文件类型的方法,普遍采用MIME Type、后缀检查、报文类型魔术字匹配等方式对文件类型进行判断,而此种方法很容易被黑客通过修改后缀、合法文件后添加木马等方法绕过检测。

针对相关技术中的问题,目前尚未提出有效的解决方案。

发明内容

针对相关技术中的问题,本发明提出一种基于RNN的Webshell检测方法及装置,适用于广大计算机从业人员的各类分布式计算的服务器端网络空间安全防护的应用场合,是一种对Webshell的高效检测的方法,以克服现有相关技术所存在的上述技术问题。

为此,本发明采用的具体技术方案如下:

根据本发明的一个方面,提供了一种基于RNN的Webshell检测方法,包括以下步骤:

S1、通过预设方法对源文件进行预处理,获取关键词;

S2、采用预设法则构建门控循环单元GRU模型,并进行训练;

S3、通过所述门控循环单元GRU模型对所述源文件进行判别。

进一步的,所述S1通过预设方法对源文件进行预处理,获取关键词具体包括以下步骤:

S11、通过预设切词对所述源文件进行切分处理,得到切词结果;

S12、采用词频-逆文档频率TF-IDF算法来对所述切词结果进行关键词提取,得到关键词。

进一步的,所述S1中在对所述源文件进行切分处理之前,保留有所述源文件中的所有信息。

进一步的,所述S11中的预设切词包括非字母字符和非数字字符,且所述非字母字符和所述非数字字符的字符串长度均介于3到15之间。

进一步的,所述S12中词频-逆文档频率TF-IDF算法的计算公式为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于紫光云(南京)数字技术有限公司,未经紫光云(南京)数字技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010809947.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top