[发明专利]适配智能芯片分级架构的基于深度学习的恶意软件检测方法有效

申请号：	202011315224.3	申请日：	2020-11-20
公开（公告）号：	CN112417451B	公开（公告）日：	2022-04-12
发明（设计）人：	杨珉;张源;张晓寒;张谧	申请（专利权）人：	复旦大学
主分类号：	G06F21/56	分类号：	G06F21/56
代理公司：	上海正旦专利代理有限公司 31200	代理人：	陆飞;陆尤
地址：	200433 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	智能芯片分级架构基于深度学习恶意软件检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种适配智能芯片分级架构的基于深度学习的恶意软件检测方法，其特征在于，基本步骤如下：

(一)针对智能芯片小核，设计第一层浅层模型结构，并根据小核特性进行模型优化；该浅层模型用于实时完成恶意软件检测中的简单任务，检测应用中发生的敏感行为；

(二)针对智能芯片大核，设计第二层深层模型结构，并根据大核特性进行优化；深层模型用于精准完成恶意软件检测中的复杂任务，检测软件恶意行为；

(三)深度学习模型的协同，实现对恶意软件的高效检测；

步骤(一)中，所述浅层模型采用卷积神经网络结构(CNN)，为适配智能芯片小核，保证浅层模型在低功耗下持续运行，在浅层模型中，设置较小的模型层数与参数，降低模型的计算量；

所述模型优化包括损失函数优化和量化优化；

(1)损失函数优化

利用检出率和精确率之间的平衡性，适当牺牲精确率来保证高的检出率，避免出现浅层模型漏报敏感行为的情况；

通过优化损失函数，在模型训练中过程中赋予敏感行为被漏判时更高的惩罚，保证敏感行为尽可能地被浅层模型检出；

(2)量化优化

量化优化可使模型的尺寸更小，推断更快，耗电更低，适配智能芯片小核，以满足在较低的计算能力、受限内存和电量消耗的周边设备中应用机器学习的需求；具体地，对于模型每一层的参数，用8位的整数模拟32位的浮点数，并对每一层的输入进行定制量化，层内使用整数加速运算，对输出进行反量化，保证输出值符合规范；

步骤(二)中，所述深层模型采用门控循环神经网络结构(GRU)；在深层模型中赋予更丰富的输入上下文信息，使其充分考察应用行为信息做出准确推断，弥补浅层模型在小算力、低功耗限制下能力的不足；

所述模型优化，使采用Boosting训练方法；具体地，对于浅层模型，根据模型结果调整数据，设置浅层模型中未被检测出的敏感行为数据更高的权重，然后将数据提供给深层模型进行训练；

步骤(三)中，两层模型采用瀑布融合型方法协同工作；并且，两层模型采用的线性加权融合的方式进行判别，具体地，为两层模型分配适当的权重，协同判别过程将对两层模型判别结果进行加权求和得出最终的结果；同时引入动态参数，对模型权重加入反馈机制，通过训练用户反馈、远程调配等方式调整模型权值，使两层模型的协同更合理准确，从而对应用行为进行全面准确的评估。

2.根据权利要求1所述适配智能芯片分级架构的基于深度学习的恶意软件检测方法，其特征在于，步骤(一)中所述损失函数优化，是使用logisticloss作为损失函数；记预测样本数为N，预测结果为真实标签为y,恶意样本记为0，正常样本记为1，则损失函数如下：

针对该损失函数，增加恶意样本预测错误的误差权重，以保证模型对恶意样本预测的准确性；记该权重值为α，则损失函数如下：

设置α1，赋予恶意样本预测错误时更高的惩罚。

3.根据权利要求1所述适配智能芯片分级架构的基于深度学习的恶意软件检测方法，其特征在于，步骤(一)中所述量化优化，是使用8bit量化对浅层模型进行进一步优化，以降低模型功耗，具体步骤如下：

(1)统计模型参数范围，根据参数范围设置映射函数；

(2)使用映射函数，将模型参数映射至0～256，完成模型网络量化；

(3)对给定的float输入，使用映射函数将输入进行量化映射；

(4)将输入带入量化后的网络，进行计算；

(5)将得到的量化输出进行逆映射，完成反量化得到最终输出。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于复旦大学，未经复旦大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】