[发明专利]支持漏洞关联性挖掘的漏洞自动分类方法有效

专利信息
申请号: 201710052203.9 申请日: 2017-01-22
公开(公告)号: CN106897625B 公开(公告)日: 2019-08-06
发明(设计)人: 胡昌振;张皓;吕坤 申请(专利权)人: 北京理工大学
主分类号: G06F21/57 分类号: G06F21/57;G06K9/62
代理公司: 北京理工正阳知识产权代理事务所(普通合伙) 11639 代理人: 毛燕
地址: 100081 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 支持 漏洞 关联性 挖掘 自动 分类 方法
【权利要求书】:

1.一种支持漏洞关联性挖掘的漏洞自动分类方法,其特征在于:其具体操作步骤为:

步骤一、构建一个漏洞数据库,收集漏洞记录;

选取国家漏洞数据库NVD作为数据源,构建一个漏洞数据库;

所述漏洞数据库包括:通用漏洞CVE编号、通用漏洞评分系统CVSS评分、是否需要网络、获取容易程度、是否需要认证、机密性影响、完整性影响、可用性影响、漏洞描述字段、前提特权集、结果特权集;

其中,通用漏洞CVE编号、通用漏洞评分系统CVSS评分、是否需要网络、获取容易程度、是否需要认证、机密性影响、完整性影响、可用性影响、漏洞描述字段字段是通过国家漏洞数据库直接获取的;前提特权集和结果特权集为空;

所述漏洞描述字段字段是用自然语言描述漏洞的特征,“漏洞描述字段”字段为“…users/attackers to…by/via…”格式;

步骤二、确定特权集类别;

特权集类别包括:系统管理员特权集、普通系统管理员特权集、普通用户特权集、访问者特权集、受限访问者特权集;

所述系统管理员特权集包含系统管理员所拥有的所有权限;系统管理员为拥有系统最高权限的用户帐号,系统管理员的权限为:管理系统设备、系统文件和系统进程,读写任意文件内容;攻击者利用系统管理员特权集造成的危害有:植入系统级木马,以虚假身份欺骗或直接追加、修改、删除、创建文件内容,造成系统不可恢复性崩溃;

所述普通系统管理员特权集包含系统管理员所拥有的部分权限;普通系统管理员的权限为:管理部分系统设备、系统文件和系统进程,读写部分系统文件内容;攻击者利用普通系统管理员特权集造成的危害有:通过追加、修改、删除、创建某些系统文件内容或系统进程内存空间的数据结构,造成系统某些文件看起来不可用、系统当机或拒绝服务;

所述普通用户特权集包含普通用户所拥有的所有权限;普通用户所拥有的权限为:在自己独立私有的资源空间内追加、修改、删除、创建个人文件;攻击者利用普通用户特权集造成的的危害有:植入用户级木马,修改普通用户的所有文件或进程空间的内容,导致用户崩溃或不可用;

所述访问者特权集包含受信任的系统远程访问者所拥有的所有权限;受信任的系统远程访问者所拥有的权限有:与系统交互数据、扫描系统信息;攻击者利用访问者特权集造成的危害有:帮助其他受限访问者用户完成身份验证或发送大量数据包造成系统内存溢出;

所述受限访问者特权集是指被系统防火墙隔离在外的不受信任的访问者所拥有的权限;不受信任的访问者仅拥有证实主机有效性的权限,不具备使用该系统的任何权限;攻击者利用受限访问者特权集不能对系统造成危害;

漏洞的前提特权集和结果特权集的取值为5个特权集类别中的一个;

步骤三、训练分类器;

针对步骤二所述的5个特权集类别,分别训练3个前提特权集训练器和4个结果特权集训练器;具体操作为:

步骤3.0:从步骤一中所述漏洞数据库中选取一部分漏洞记录,作为训练数据集;然后人工标注每条漏洞记录的前提特权集和结果特权集;

步骤3.1:从训练数据集中选取前提特权集为普通用户特权集的300条以上数据;

步骤3.2:对每条训练数据中的“漏洞描述字段”字段进行处理;“漏洞描述字段”字段为“…user/attackers to…by/via…”格式;将“by/via”之后的部分截取出来,存入文件d1中,每条训练数据占一行,文件d1的行数用符号J1表示;

步骤3.3:利用开源分词工具StandardAnalyzer对文件d1进行处理,统计每个单词出现的数量,文件d1中出现的单词的数量用符号I1表示;

步骤3.4:通过公式(1)计算单词的重要性;

其中,tfi,j表示第i个单词在第j行的重要性,i和j均为正整数,并且i∈[1,I1],j∈[1,J1];ni,j表示第i个单词在第j行中出现的次数;

步骤3.5:通过公式(2)计算第i个单词的逆向文件频率,用符号idfi表示;逆向文件频率用来度量单词的普遍性;

其中,ti表示第i个单词;|{j:ti∈rj}|表示文件d1包含单词ti的行数;

步骤3.6:通过公式(3)计算单词的权重得分;

其中,TFIDFi表示第i个单词的权重得分;

某一行的高词语频率,以及该词语在整个文件内的低行数频率,可以产生高权重的TFIDFi;因此,TFIDFi值倾向于过滤掉常见词语,保留重要的词语;

步骤3.7:将文件d1中出现的单词按照TFIDFi值降序排列,取前n个词作为特征关键词,n∈[5,12];记录特征关键词及对应的TFIDFi值;

步骤3.8:经过步骤3.1至3.7的操作,得到前提特权集为普通用户特权集对应的特征关键词及对应的TFIDFi值;

步骤3.9:从训练数据集中选取前提特权集为访问者特权集的300条以上数据;重复3.2至至3.7的操作,得到前提特权集为访问者特权集对应的特征关键词及对应的TFIDFi值;

步骤3.10:从训练数据集中选取前提特权集为受限访问者特权集的300条以上数据;重复3.2至至3.7的操作,得到前提特权集为受限访问者特权集对应的特征关键词及对应的TFIDFi值;

步骤3.11:从训练数据集中选取结果特权集为系统管理员特权集的300条以上数据;

步骤3.12:对每条训练数据中的“漏洞描述字段”字段进行处理;“漏洞描述字段”字段为“…user/attackers to…by/via…”格式;将“to”到“by/via”之间的部分截取出来,存入文件d2中,每条训练数据占一行,文件d2的行数用符号J2表示;

步骤3.13:利用开源分词工具StandardAnalyzer对文件d2进行处理,统计每个单词出现的数量,文件d2中出现的单词的数量用符号I2表示;

步骤3.14:通过公式(4)计算单词的重要性;

其中,tfi′,j′表示第i′个单词在第j′行的重要性,i′和j′均为正整数,并且i∈[1,I2],j∈[1,J2];ni′,j′表示第i′个单词在第j′行中出现的次数;

步骤3.15:通过公式(5)计算第i′个单词的逆向文件频率,用符号idfi′表示;逆向文件频率用来度量单词的普遍性;

其中,ti′表示第i′个单词;|{j′:ti′∈rj′}|表示文件d2包含单词ti′的行数;

步骤3.16:通过公式(6)计算单词的权重得分;

其中,TFIDFi′表示第i′个单词的权重得分;

步骤3.17:将文件d2中出现的单词按照TFIDFi′值降序排列,取前n个词作为特征关键词,n∈[5,12];记录特征关键词及对应的TFIDFi′值;

步骤3.18:经过步骤3.11至3.17的操作,得到结果特权集为系统管理员特权集对应的特征关键词及对应的TFIDFi′值;

步骤3.19:从训练数据集中选取结果特权集为普通系统管理员特权集的300条以上数据;重复3.12至至3.17的操作,得到结果特权集为普通系统管理员特权集对应的特征关键词及对应的TFIDFi′值;

步骤3.20:从训练数据集中选取结果特权集为普通用户特权集的300条以上数据;重复3.12至至3.17的操作,得到结果特权集为普通用户特权集对应的特征关键词及对应的TFIDFi′值;

步骤3.21:从训练数据集中选取结果特权集为访问者特权集的300条以上数据;重复3.12至至3.17的操作,得到结果特权集为访问者特权集对应的特征关键词及对应的TFIDFi′值;

步骤四、测试数据;

步骤4.1:从步骤一中所述漏洞数据库中选取一条测试数据;

步骤4.2:对测试数据中的“漏洞描述字段”字段进行处理;“漏洞描述字段”字段为“…user/attackers to…by/via…”格式;将“by/via”之后的部分截取出来,并利用开源分词工具StandardAnalyzer处理,得到若干个单词;

步骤4.3:对于步骤4.2得到的单词,依次查找每个单词是否在步骤3.8得到前提特权集为普通用户特权集对应的特征关键词中出现,如果出现,则记录该特征关键词对应的TFIDFi值并求和,结果用符号P1表示;

步骤4.4:对于步骤4.2得到的单词,依次查找每个单词是否在步骤3.9得到前提特权集为访问者特权集对应的特征关键词中出现,如果出现,则记录该特征关键词对应的TFIDFi值并求和,结果用符号P2表示;

步骤4.5:对于步骤4.2得到的单词,依次查找每个单词是否在步骤3.10得到前提特权集为受限访问者特权集对应的特征关键词中出现,如果出现,则记录该特征关键词对应的TFIDFi值并求和,结果用符号P3表示;

步骤4.6:比较P1、P2和P3的值,选取最大值对应的特权集作为该条测试数据的前提特权集的值;

步骤4.7:对测试数据中的“漏洞描述字段”字段进行处理;“漏洞描述字段”字段为“…user/attackers to…by/via…”格式;将“to”到“by/via”之间的部分截取出来,并利用开源分词工具StandardAnalyzer处理,得到若干个单词;

步骤4.8:对于步骤4.7得到的单词,依次查找每个单词是否在步骤3.18得到结果特权集为系统管理员特权集对应的特征关键词中出现,如果出现,则记录该特征关键词对应的TFIDFi′值并求和,结果用符号R1表示;

步骤4.9:对于步骤4.7得到的单词,依次查找每个单词是否在步骤3.19得到结果特权集为普通系统管理员特权集对应的特征关键词中出现,如果出现,则记录该特征关键词对应的TFIDFi′值并求和,结果用符号R2表示;

步骤4.10:对于步骤4.7得到的单词,依次查找每个单词是否在步骤3.20得到结果特权集为普通用户特权集对应的特征关键词中出现,如果出现,则记录该特征关键词对应的TFIDFi′值并求和,结果用符号R3表示;

步骤4.11:对于步骤4.7得到的单词,依次查找每个单词是否在步骤3.21得到访问者特权集对应的特征关键词中出现,如果出现,则记录该特征关键词对应的TFIDFi′值并求和,结果用符号R4表示;

步骤4.12:比较R1、R2、R3和R4的值,选取最大值对应的特权集作为该条测试数据的结果特权集的值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710052203.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top