[发明专利]一种面向恶意软件标签翻转攻击的正则化识别方法及装置有效
| 申请号: | 202110780770.2 | 申请日: | 2021-07-09 |
| 公开(公告)号: | CN113656798B | 公开(公告)日: | 2023-09-05 |
| 发明(设计)人: | 罗熊;王礼伟;孙建鹍 | 申请(专利权)人: | 北京科技大学 |
| 主分类号: | G06F21/56 | 分类号: | G06F21/56;G06F18/2415;G06N3/0442;G06N3/048;G06N3/084 |
| 代理公司: | 北京市广友专利事务所有限责任公司 11237 | 代理人: | 张仲波;付忠林 |
| 地址: | 100083*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 恶意 软件 标签 翻转 攻击 正则 识别 方法 装置 | ||
本发明公开了一种面向恶意软件标签翻转攻击的正则化识别方法及装置,该方法包括:基于足量的良性与恶意程序的行为序列,构建训练数据集;构建分类模型;构建正则化层,并将构建的正则化层添加到所构建的分类模型中,以使得在模型的训练过程中,分类模型的输出得以拟合实际的概率分布;基于数据集,联合训练分类模型和正则化层;训练完后,去除正则化层,利用分类模型对待检程序进行分类和检测。本发明针对深度学习模型训练过程中存在的标签翻转攻击问题,提出了一种对应的正则化识别技术,增强了模型的鲁棒性。
技术领域
本发明涉及恶意软件检测技术领域,特别涉及一种面向恶意软件标签翻转攻击的正则化识别方法及装置。
背景技术
随着物联网技术的兴起,越来越多的智能设备接入到网络中,针对这类智能设备的新型恶意攻击手段也日趋多样化。为了有效检测各类新型的恶意软件变种,深度学习技术被引入到恶意软件识别领域当中。
深度学习模型能够充分利用物联网技术带来的大数据优势,从实际恶意软件行为数据中提取出抽象的高层次行为特征。因此,深度学习模型具有很好的泛化能力,能够有效识别新型的恶意软件变种。而随着基于深度学习的启发式恶意软件检测模型的发展,部分攻击者将攻击目标转向了面向恶意软件检测的深度学习模型。
目前的基于深度学习模型的恶意软件检测以监督学习为主,通过学习恶意行为数据和攻击类别的对应关系对恶意攻击建模分析。其过程遵循通用的检测分类流程:首先,收集足量的样本数据。其次,针对恶意软件特征选定具体深度学习模型,在此过程中常用的分类模型有深度神经网络、卷积神经网络和循环神经网络等。随后,设计梯度下降算法,并基于足量数据集训练分类模型。最终将训练完成的分类模型应用于恶意软件的检测和分类。对此,面向深度学习模型的攻击方法利用监督学习的特点通过翻转恶意行为数据的对应标签,引入标签噪声,而现有的研究和实践表明,当数据集含有标签噪声的时候,将会显著降低分类模型的性能,降低深度学习模型的学习能力。
发明内容
本发明提供了一种面向恶意软件标签翻转攻击的正则化识别方法及装置,以解决传统的恶意软件检测模型的训练流程并未考虑到翻转攻击等引入的标签噪声的影响,由此造成模型学习能力和分类性能降低的技术问题。
为解决上述技术问题,本发明提供了如下技术方案:
一方面,本发明提供了一种面向恶意软件标签翻转攻击的正则化识别方法,该面向恶意软件标签翻转攻击的正则化识别方法包括:
基于足量的良性与恶意程序的行为序列,构建训练数据集;
构建分类模型;所述分类模型的输入为程序行为序列,输出为程序类别;其中,所述程序类别包括良性程序和恶意程序;
构建正则化层,并将所述正则化层添加到所述分类模型中,以使得在所述分类模型的训练过程中,所述分类模型的输出得以拟合实际的概率分布;
基于所述训练数据集,联合训练所述分类模型和所述正则化层;训练完后,去除所述正则化层,利用所述分类模型对待检程序进行分类和检测。
进一步地,所述正则化层的数学形式表示为矩阵R,其计算方法如下:
r=sigmoid(β)
其中,R为一个对称且每一列均是一个概率分布的矩阵,I表示单位矩阵,1表示元素全为1的列向量,T表示矩阵的转置,c表示待分类程序的类别个数,r为经过sigmoid激活函数后的条件概率,β为所述正则化层的实际训练参数。
进一步地,联合训练所述分类模型和所述正则化层时,损失函数设计如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110780770.2/2.html,转载请声明来源钻瓜专利网。





