[发明专利]提高基于深度学习的源代码漏洞检测健壮性的方法及装置有效

专利信息
申请号: 202110263311.7 申请日: 2021-03-10
公开(公告)号: CN112989358B 公开(公告)日: 2022-07-01
发明(设计)人: 邹德清;唐静;李珍;金海 申请(专利权)人: 华中科技大学
主分类号: G06F21/57 分类号: G06F21/57;G06K9/62;G06N3/04;G06N3/08
代理公司: 北京之于行知识产权代理有限公司 11767 代理人: 何志欣
地址: 430074 湖北*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 提高 基于 深度 学习 源代码 漏洞 检测 健壮性 方法 装置
【说明书】:

本发明涉及一种提高基于深度学习的源代码漏洞检测健壮性的方法及装置,装置至少包括代码变换模块、映射模块和神经网络模块,映射模块与代码变换模块、映射模块和神经网络模块分别建立数据连接关系,神经网络模块包括至少两个第一分类器,代码变换模块基于接收的第一训练程序源码以代码变换的方式生成具有可攻击性的第二训练程序源码,映射模块将由第二训练程序源码分离形成的若干代码片段映射为第二样本向量,神经网络模块基于与第一训练程序源码对应的第一样本向量和与第二训练程序源码对应的第二样本向量训练至少两个第一分类器直至训练数据达到训练阈值。本发明通过对特征生成器和分类器进行分类训练,提高了源代码漏洞检测健壮性。

技术领域

本发明涉及源代码漏洞检测技术领域,尤其涉及一种提高基于深度学习的源代码漏洞检测健壮性的方法及装置。

背景技术

当前国际网络安全形式严峻,软件漏洞问题尚未解决,有效检测未知漏洞,进而及时修复漏洞对于系统安全至关重要,目前主流的基于静态分析的漏洞检测技术主要有基于相似性的漏洞检测,基于规则的漏洞检测和基于机器学习的漏洞检测方法。基于相似性的漏洞检测用于检测由代码复制导致的漏洞,基于规则的漏洞检测使用专家定义的规则检测漏洞,人工干预的主观性强,并且规则可能不完善,而基于深度学习的漏洞检测不需要人工定义漏洞的特征,可以大大降低漏报率和误报率。

然而,基于深度学习的漏洞检测模型的健壮性差,容易受到例如代码变换等导致的攻击。源程序的代码变换包括三类:语义保留的代码变换、语义近似的代码变换和语义改变的代码变换。常见的代码变换工具包括Tigress、Stunnix obfuscator、Sourceformatx、Coccinelle等。这些代码变换可以应用到不同的研究领域,例如代码格式化、代码补全和重构、逆向工程的防御、代码克隆检测的评价以及神经网络程序嵌入的评价等,但尚无代码变换应用于漏洞检测的研究。

例如,专利文献CN103268281B公开了一种源代码漏洞检测方法及其系统,方法包括:S1、获取目标检测源代码的编程语言,根据编程语言编写的源代码所存在的安全漏洞构建安全漏洞规则库;S2、对目标检测源代码进行编译,生成中间表示文件,对中间表示文件进行解析,提取中间表示文件的上下文信息并存储起来;S3、依据存储的上下文信息构建调度上下文的状态自动机;S4、对状态自动机中的状态空间进行遍历,分别判断状态自动机中各状态空间是否与安全漏洞规则库中的规则相匹配,若是则获取产生漏洞的执行路径。

目前尚无关于提高基于深度学习的漏洞检测健壮性的研究,对抗训练是一种提高基于深度学习的模型健壮性的重要方法。对抗训练广泛应用于图像处理、语音识别、恶意软件检测等领域,但由于程序语言的结构化性质,图像和文本领域的对抗训练方法不适用于源代码相关深度学习模型,以图像处理为例,图像像素的变化是连续的,像素的微小变化不容易察觉,且一般不会影响语义。然而,代码的变化是离散的,代码元素的微小变化很可能导致语法错误,容易察觉,且会影响语句的语义。近年来,在源代码应用领域,针对深度学习模型健壮性的研究刚刚起步,例如将对抗训练应用于作者归属识别,函数功能预测等方面,通常这些代码变换对开发人员来说是合理的,但却能使基于深度学习的模型产生错误的分类结果。我们通过分析现有技术对深度学习模型实现的攻击,进行提升模型健壮性的研究。

此外,一方面由于对本领域技术人员的理解存在差异;另一方面由于发明人做出本发明时研究了大量文献和专利,但篇幅所限并未详细罗列所有的细节与内容,然而这绝非本发明不具备这些现有技术的特征,相反本发明已经具备现有技术的所有特征,而且申请人保留在背景技术中增加相关现有技术之权利。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110263311.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top