[发明专利]一种基于加权词向量和神经网络的软件漏洞自动分类方法在审
| 申请号: | 202210614135.1 | 申请日: | 2022-05-31 |
| 公开(公告)号: | CN114881172A | 公开(公告)日: | 2022-08-09 |
| 发明(设计)人: | 王倩;高玉莹;任家东;张炳 | 申请(专利权)人: | 燕山大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F40/289;G06N3/04;G06N3/08 |
| 代理公司: | 石家庄众志华清知识产权事务所(特殊普通合伙) 13123 | 代理人: | 王忠良 |
| 地址: | 066004 河北*** | 国省代码: | 河北;13 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 加权 向量 神经网络 软件 漏洞 自动 分类 方法 | ||
本发明公开了一种基于加权词向量和神经网络的软件漏洞自动分类方法,属于计算机软件安全领域,包括以下步骤:S1,对漏洞详细描述文本的数据预处理;S2,漏洞文本经过预处理后,通过Word2Vec模型和N‑TF‑IDF算法结合构造加权词向量,完成文本向量表示;S3,基于神经网络的TCNN‑BiGRU漏洞分类模型实现漏洞自动分类,模型主要包括4个部分,分别为输入层、TextCNN结构、BiGRU结构和全连接层。本发明能够满足对软件漏洞的自动化分类需求,且不受漏洞数量和漏洞种类增多的限制,有效地处理词向量空间的高维性和稀疏性问题,在准确率、宏精确率、宏召回率和宏F1值等多维评价指标中表现出较好性能。
技术领域
本发明属于计算机软件安全领域,涉及一种基于加权词向量和神经网络的软件漏洞自动分类方法。
背景技术
近年来,计算机软件漏洞的数量和种类逐渐增多,美国国家计算机通用漏洞数据库(National Vulnerability Database,NVD)2021年共报告了18378个漏洞,创下历史新高,对漏洞的有效分析和管理变得越来越重要。漏洞分类是软件开发和软件质量维护中的一项重要活动,不同类型的漏洞其危害程度不同,通过提取漏洞描述中的特征属性对漏洞进行及时分类,可以有效降低漏洞管理与系统维护的成本。漏洞自动化分类模型的研究应运而生。
早期的计算机安全漏洞分类方法有很多种,主要有RISOS分类法、PA分类法、Aslam分类法等。RISOS分类法的描述方式是安全漏洞的攻击方式,主要研究的是操作系统漏洞,难以应对现有的各种复杂漏洞;PA分类法在RISOS的基础上进一步讨论了操作系统之上应用程序的安全漏洞;Aslam分类法对应的平台是UNIX操作系统,考虑的是系统内核级别的漏洞。由于近年来计算机安全漏洞层出不穷,发现漏洞的位置也不再仅仅局限于操作系统和服务器,而多集中在Web浏览器、数据或系统备份恢复软件、防病毒软件等。因此,早期的分类方法已经不能满足对目前存在的各种漏洞进行分类的要求,传统的人工漏洞分类方法也已经不再适用,漏洞的挖掘技术更加自动化和智能化。
现有的漏洞自动分类方法多采用机器学习的经典分类算法及改进算法,在一定程度上提高了漏洞自动分类的准确率。Davari等人提出了一种基于激活漏洞条件的漏洞自动分类框架,使用常见机器学习技术构建具有最高F1-score的分类器来标记未知漏洞,该方法在Firefox项目的580个软件安全漏洞数据集上表现良好。Yang等人为提高基于支持向量机的漏洞自动分类方法的性能,采用模糊熵进行特征选择,由TF-IDF确定特征权重,利用改进的粒子群算法对支持向量机的参数进行优化。与传统支持向量机方法相比,该方法提高了分类准确率并缩短了分类时间。Jinfu Chen等人提出了一种基于频率-逆重力矩(TF-IGM)和特征选择的漏洞严重性分类框架,通过实验证明了TF-IGM模型及特征选择的优越性,在不同数据集之间存在显著差异。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于燕山大学,未经燕山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210614135.1/2.html,转载请声明来源钻瓜专利网。





