[发明专利]一种基于图卷积网络的恶意软件检测方法有效

专利信息
申请号: 202110289916.3 申请日: 2021-03-18
公开(公告)号: CN112966271B 公开(公告)日: 2022-09-16
发明(设计)人: 金舒原;李维龙 申请(专利权)人: 中山大学
主分类号: G06F21/56 分类号: G06F21/56;G06F8/53;G06N3/04;G06N3/08
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 刘俊
地址: 510275 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 图卷 网络 恶意 软件 检测 方法
【权利要求书】:

1.一种基于图卷积网络的恶意软件检测方法,其特征在于,包括以下步骤:

S1:采集二进制文件并进行预处理,从二进制文件中得到函数的汇编指令序列;

S2:将所述汇编指令序列作为语料库,在汇编指令语料库上训练汇编指令的词向量模型;

S3:采集大量的恶意软件样本和正常软件样本,构建训练样本库;

S4:对训练样本库样本进行预处理,从每个样本中抽取函数调用图及每个函数的汇编指令序列;

S5:构建基于图卷积网络的恶意软件检测模型,将从样本库中获得的汇编指令序列作为输入,并根据对应的词向量模型及函数调用图对所述恶意软件检测模型进行训练;恶意软件检测模型包括依次连接的嵌入层、GRU层、图卷积层和全连接层,其中,所述嵌入层的权重来源于训练的词向量模型;所述GRU层为一个单层双向的GRU层;所述图卷积层包括2个Structure2Vec层;所述全连接层包括带一个隐藏层的全连接神经网络;

所述函数调用图和函数指令序列对所述恶意软件检测模型进行训练的步骤包括:

S51:将所述词向量模型的权重加载到嵌入层;

S52:从样本库中取出一个样本i的函数调用图FCGi及其汇编指令序列集合Si

S53:将所述汇编指令序列集合Si中每个汇编指令序列输入所述嵌入层,将每个汇编指令序列转化为向量序列,得到向量序列集合Vi

S54:将所述向量序列集合Vi中的向量序列输入所述GRU层,将每个向量序列转化为相应的向量,得到向量集合Vi

S55:对于每个函数,将其生成的向量附加到其在函数调用图中对应的顶点上,得到属性函数调用图

式中,Ni为调用图中节点的集合;Ei为有向边的集合,保存了函数间的调用关系;表示初始的向量集合;

S56:将所述属性函数调用图输入所述Structure2Vec层中进行两轮迭代更新计算,得到新的属性函数调用图将属性函数调用图中每个结点的向量进行平均,得到最终的图嵌入向量gi

S57:将所述图嵌入向量gi输入所述全连接层中进行预测,并根据预测结果和真实的结果计算损失loss,根据损失loss计算结果采用优化器对所述恶意软件检测模型中的权重进行更新;

S58:重复执行S52~57步骤至损失loss收敛;

S6:将完成训练的恶意软件检测模型对待检测的软件进行检测,输出检测结果。

2.根据权利要求1所述的基于图卷积网络的恶意软件检测方法,其特征在于,所述S1步骤中,对二进制文件进行预处理的步骤包括利用反汇编工具分析所述二进制文件,抽取所述二进制文件中每个函数的汇编指令序列。

3.根据权利要求2所述的基于图卷积网络的恶意软件检测方法,其特征在于,对抽取的汇编指令序列进行以下替换操作:

(1)将汇编指令序列中的立即数替换为IMM;

(2)将汇编指令序列中的直接内存访问替换为MEM;

(3)将汇编指令序列中的函数名引用替换为FUNC。

4.根据权利要求1所述的基于图卷积网络的恶意软件检测方法,其特征在于,所述S2步骤中,将所述语料库中的每个指令序列视为文档,每条指令视为单词,构建skip-gram模型并对其进行训练,得到汇编指令的词向量模型,该模型将汇编指令转化为d维向量。

5.根据权利要求1所述的基于图卷积网络的恶意软件检测方法,其特征在于,所述S4步骤中,对训练样本库样本进行预处理的步骤包括:

S41:对所述训练样本库样本进行脱壳:采用查壳工具对训练样本库样本进行检测,检测其是否经过加壳处理:若是,则进一步识别其加壳算法,根据所述加壳算法选用相应的脱壳工具进行脱壳,得到原始样本文件,若无法脱壳,则直接丢弃所述训练样本库样本;若否,则执行S42步骤;

S42:利用反汇编工具分析所述训练样本库样本,抽取所述训练样本库样本的函数调用图及其中每个函数的汇编指令序列。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110289916.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top