[发明专利]恶意文件识别方法、装置、设备及存储介质在审

申请号：	202110146065.7	申请日：	2021-02-03
公开（公告）号：	CN112883375A	公开（公告）日：	2021-06-01
发明（设计）人：	刘彬彬;杨达明;李泽莹	申请（专利权）人：	深信服科技股份有限公司
主分类号：	G06F21/56	分类号：	G06F21/56;G06K9/62
代理公司：	深圳市世纪恒程知识产权代理事务所 44287	代理人：	关向兰
地址：	518000 广东省深圳市南***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	恶意文件识别方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明属于恶意文件识别的技术领域，公开了一种恶意文件识别方法、装置、设备及存储介质。该方法包括：获取样本文件，对样本文件进行特征提取，获得样本文件的第一特征；基于内存映射方式根据第一特征，获得经降维处理的第二特征；根据第二特征对样本文件进行人工智能预测，以识别样本文件是否为恶意文件。相对于现有的将样本文件的特征全部加载到内存中进行特征降维，进而识别恶意文件的方式，本发明上述方式能够有效解决进行恶意文件识别时运行内存过高的问题。

技术领域

本发明涉及恶意文件识别的技术领域，尤其涉及一种恶意文件识别方法、装置、设备及存储介质。

背景技术

在进行恶意文件识别时通常需要先进行降维操作，一些算法在高维度数据上容易表现不佳,降维可提高算法可用性。降维可以用删除冗余特征解决多重共线性问题，降维模型通常具有较为复杂的数据结构，例如原始数据结构由一阶特征、一阶特征对应二阶特征的向量维度信息、一阶特征数量、二阶特征数量等，向量维度通常包括维度坐标、权重等信息。由此组成的数据结构往往需要很大的内存存储，而内存占用过高会产生电脑卡顿,运行不流畅等问题，因此，进行降维操作时，如何优化内存成为了亟待解决的问题。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本发明的主要目的在于提供了一种恶意文件识别方法、装置、设备及存储介质，旨在解决现有技术进行恶意文件识别时内存占用过高的技术问题。

为实现上述目的，本发明提供了一种恶意文件识别方法，所述方法包括以下步骤：

获取样本文件，对所述样本文件进行特征提取，获得所述样本文件的第一特征；

基于内存映射方式根据所述第一特征，获得经降维处理的第二特征；

根据所述第二特征对所述样本文件进行人工智能预测，以识别所述样本文件是否为恶意文件。

在可能的实施例中，所述基于内存映射方式根据所述第一特征，获得经降维处理的第二特征包括：

基于内存映射方式，对所述第一特征进行降维操作，获得所述第二特征；

在可能的实施例中，所述根据所述第二特征对所述样本文件进行人工智能预测，包括：

根据所述第二特征提取所述样本文件的字符串特征；

利用预设预测模型对所述字符串特征进行预测，以识别所述样本文件是否为恶意文件。