[发明专利]适配智能芯片分级架构的基于深度学习的恶意软件检测方法有效
| 申请号: | 202011315224.3 | 申请日: | 2020-11-20 |
| 公开(公告)号: | CN112417451B | 公开(公告)日: | 2022-04-12 |
| 发明(设计)人: | 杨珉;张源;张晓寒;张谧 | 申请(专利权)人: | 复旦大学 |
| 主分类号: | G06F21/56 | 分类号: | G06F21/56 |
| 代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
| 地址: | 200433 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 智能 芯片 分级 架构 基于 深度 学习 恶意 软件 检测 方法 | ||
1.一种适配智能芯片分级架构的基于深度学习的恶意软件检测方法,其特征在于,基本步骤如下:
(一)针对智能芯片小核,设计第一层浅层模型结构,并根据小核特性进行模型优化;该浅层模型用于实时完成恶意软件检测中的简单任务,检测应用中发生的敏感行为;
(二)针对智能芯片大核,设计第二层深层模型结构,并根据大核特性进行优化;深层模型用于精准完成恶意软件检测中的复杂任务,检测软件恶意行为;
(三)深度学习模型的协同,实现对恶意软件的高效检测;
步骤(一)中,所述浅层模型采用卷积神经网络结构(CNN),为适配智能芯片小核,保证浅层模型在低功耗下持续运行,在浅层模型中,设置较小的模型层数与参数,降低模型的计算量;
所述模型优化包括损失函数优化和量化优化;
(1)损失函数优化
利用检出率和精确率之间的平衡性,适当牺牲精确率来保证高的检出率,避免出现浅层模型漏报敏感行为的情况;
通过优化损失函数,在模型训练中过程中赋予敏感行为被漏判时更高的惩罚,保证敏感行为尽可能地被浅层模型检出;
(2)量化优化
量化优化可使模型的尺寸更小,推断更快,耗电更低,适配智能芯片小核,以满足在较低的计算能力、受限内存和电量消耗的周边设备中应用机器学习的需求;具体地,对于模型每一层的参数,用8位的整数模拟32位的浮点数,并对每一层的输入进行定制量化,层内使用整数加速运算,对输出进行反量化,保证输出值符合规范;
步骤(二)中,所述深层模型采用门控循环神经网络结构(GRU);在深层模型中赋予更丰富的输入上下文信息,使其充分考察应用行为信息做出准确推断,弥补浅层模型在小算力、低功耗限制下能力的不足;
所述模型优化,使采用Boosting训练方法;具体地,对于浅层模型,根据模型结果调整数据,设置浅层模型中未被检测出的敏感行为数据更高的权重,然后将数据提供给深层模型进行训练;
步骤(三)中,两层模型采用瀑布融合型方法协同工作;并且,两层模型采用的线性加权融合的方式进行判别,具体地,为两层模型分配适当的权重,协同判别过程将对两层模型判别结果进行加权求和得出最终的结果;同时引入动态参数,对模型权重加入反馈机制,通过训练用户反馈、远程调配等方式调整模型权值,使两层模型的协同更合理准确,从而对应用行为进行全面准确的评估。
2.根据权利要求1所述适配智能芯片分级架构的基于深度学习的恶意软件检测方法,其特征在于,步骤(一)中所述损失函数优化,是使用logisticloss作为损失函数;记预测样本数为N,预测结果为真实标签为y,恶意样本记为0,正常样本记为1,则损失函数如下:
针对该损失函数,增加恶意样本预测错误的误差权重,以保证模型对恶意样本预测的准确性;记该权重值为α,则损失函数如下:
设置α1,赋予恶意样本预测错误时更高的惩罚。
3.根据权利要求1所述适配智能芯片分级架构的基于深度学习的恶意软件检测方法,其特征在于,步骤(一)中所述量化优化, 是使用8bit量化对浅层模型进行进一步优化,以降低模型功耗,具体步骤如下:
(1)统计模型参数范围,根据参数范围设置映射函数;
(2)使用映射函数,将模型参数映射至0~256,完成模型网络量化;
(3)对给定的float输入,使用映射函数将输入进行量化映射;
(4)将输入带入量化后的网络,进行计算;
(5)将得到的量化输出进行逆映射,完成反量化得到最终输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011315224.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:虚拟对象控制方法、装置、终端及存储介质
- 下一篇:一种绿色建筑墙板切割装置





