[发明专利]基于Two-Head异常检测模型的恶意代码样本筛选器及方法有效
申请号: | 202010790742.4 | 申请日: | 2020-08-07 |
公开(公告)号: | CN111898129B | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 田东海;蔡静轩;马锐;李家硕;张博 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F21/56 | 分类号: | G06F21/56;G06K9/62;G06N3/04 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 高会允 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 two head 异常 检测 模型 恶意代码 样本 筛选 方法 | ||
1.基于Two-Head异常检测模型的恶意代码样本筛选器,用于对基于卷积神经网络模型构建的恶意代码检测模型进行样本筛选,其特征在于,所述筛选器包括特征提取器、第一分类层、第二分类层、softmax函数模块以及不确定性度量模块;
所述特征提取器包括所述恶意代码检测模型中的特征提取部分;
所述第一分类层和所述第二分类层采用所述恶意代码检测模型中的分类层结构,第一分类层和第二分类层并行连接在所述特征提取器输出端;
所述第一分类层和第二分类层的输出分别经softmax函数模块输出第一分类概率值和第二分类概率值;
所述第一分类概率值和第二分类概率值输入至一个不确定性度量模块中;所述不确定性度量模块的输出为分类结果标签。
2.如权利要求1所述的样本筛选器,其特征在于,所述特征提取器、第一分类层、第二分类层的超参数设置为与所述恶意代码检测模型相同的超参数。
3.基于Two-Head异常检测模型的恶意代码样本筛选方法,其特征在于,该方法用于对基于卷积神经网络模型构建的恶意代码检测模型进行样本筛选,包括:
步骤1)取恶意代码检测模型的训练集中的恶意代码检测训练样本,进行数据特征提取,构建异常检测训练样本;
步骤2)所述恶意代码检测模型基于卷积神经网络模型构建,基于此构建Two-Head异常检测模型,具体为:
取所述恶意代码检测模型中的特征提取部分作为特征提取器,在所述特征提取器后并行添加第一分类层C1和第二分类层C2;所述第一分类层C1和第二分类层C2的输出分别经归一化指数函数即softmax函数输出第一分类概率值和第二分类概率值;第一分类概率值和第二分类概率值输入至一个不确定性度量函数中;所述不确定性度量函数的输出为分类结果标签;
步骤3)采用所述恶意代码训练样本对所构建的Two-Head异常检测模型进行训练,使得Two-Head异常检测模型的损失值达到收敛,获得训练好的Two-Head异常检测模型;
步骤4)使用所述训练好的Two-Head异常检测模型对待输入至恶意代码检测模型的恶意代码检测样本进行筛选。
4.如权利要求3所述的样本筛选器,其特征在于,所述特征提取器、第一分类层、第二分类层的超参数设置为与所述恶意代码检测模型相同的超参数。
5.如权利要求3所述的方法,其特征在于,所述步骤4)具体包括如下步骤:
步骤401)取恶意代码检测模型的测试集中的恶意代码检测测试样本;将所述恶意代码检测测试样本输入至所述训练好的Two-Head异常检测模型,获得针对恶意代码检测测试样本的分类结果标签;
步骤402)选取分类结果标签为设定值的恶意代码检测测试样本为正常样本,即为恶意代码样本筛选结果。
6.如权利要求3或5所述的方法,其特征在于,所述步骤1)包括如下具体步骤:
S101)取恶意代码检测模型的训练集中的恶意代码检测训练样本,提取恶意代码检测训练样本的二进制字节流特征得到二进制字节序列;
S102)将所述二进制字节序列转换成0-255区间内的10进制整数,得到整数序列;
S103)对每个恶意代码检测训练样本对应的整数序列进行长度归一化处理得到数据特征提取结果,构建为异常检测训练样本。
7.如权利要求3或5所述的方法,其特征在于,所述步骤3)中,Two-Head异常检测模型的损失值为
其中xi为第i分类层的输入,yi为第i分类层的输出;i取值为1和2;pi(yi|xi)为第i分类层的输入为xi时,输出为yi的概率,即p1(y1|x1)为第一分类概率值;p2(y2|x2)为第二分类概率值;XN为异常检测训练样本的集合。
8.如权利要求3或5所述的方法,其特征在于,所述步骤2)中的不确定性度量函数具体为:
score=|max(p1(y1|x1))-max(p2(y2|x2))|
其中xi∈XN,i=1或2;xi为第i分类层的输入,yi为第i分类层的输出;i取值为1和2;pi(yi|xi)为第i分类层的输入为xi时,输出为yi的概率,即p1(y1|x1)为第一分类概率值;p2(y2|x2)为第二分类概率值;XN为异常检测训练样本的集合;score为不确定性度量结果;
设定分类阈值δ,δ依据经验设定;
所述Two-Head异常检测模型分类结果标签为y:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010790742.4/1.html,转载请声明来源钻瓜专利网。