[发明专利]恶意文件识别方法、装置、设备及存储介质在审
| 申请号: | 202110146065.7 | 申请日: | 2021-02-03 |
| 公开(公告)号: | CN112883375A | 公开(公告)日: | 2021-06-01 |
| 发明(设计)人: | 刘彬彬;杨达明;李泽莹 | 申请(专利权)人: | 深信服科技股份有限公司 |
| 主分类号: | G06F21/56 | 分类号: | G06F21/56;G06K9/62 |
| 代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 关向兰 |
| 地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 恶意 文件 识别 方法 装置 设备 存储 介质 | ||
本发明属于恶意文件识别的技术领域,公开了一种恶意文件识别方法、装置、设备及存储介质。该方法包括:获取样本文件,对样本文件进行特征提取,获得样本文件的第一特征;基于内存映射方式根据第一特征,获得经降维处理的第二特征;根据第二特征对样本文件进行人工智能预测,以识别样本文件是否为恶意文件。相对于现有的将样本文件的特征全部加载到内存中进行特征降维,进而识别恶意文件的方式,本发明上述方式能够有效解决进行恶意文件识别时运行内存过高的问题。
技术领域
本发明涉及恶意文件识别的技术领域,尤其涉及一种恶意文件识别方法、装置、设备及存储介质。
背景技术
在进行恶意文件识别时通常需要先进行降维操作,一些算法在高维度数据上容易表现不佳,降维可提高算法可用性。降维可以用删除冗余特征解决多重共线性问题,降维模型通常具有较为复杂的数据结构,例如原始数据结构由一阶特征、一阶特征对应二阶特征的向量维度信息、一阶特征数量、二阶特征数量等,向量维度通常包括维度坐标、权重等信息。由此组成的数据结构往往需要很大的内存存储,而内存占用过高会产生电脑卡顿,运行不流畅等问题,因此,进行降维操作时,如何优化内存成为了亟待解决的问题。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供了一种恶意文件识别方法、装置、设备及存储介质,旨在解决现有技术进行恶意文件识别时内存占用过高的技术问题。
为实现上述目的,本发明提供了一种恶意文件识别方法,所述方法包括以下步骤:
获取样本文件,对所述样本文件进行特征提取,获得所述样本文件的第一特征;
基于内存映射方式根据所述第一特征,获得经降维处理的第二特征;
根据所述第二特征对所述样本文件进行人工智能预测,以识别所述样本文件是否为恶意文件。
在可能的实施例中,所述基于内存映射方式根据所述第一特征,获得经降维处理的第二特征包括:
基于内存映射方式,对所述第一特征进行降维操作,获得所述第二特征;
在可能的实施例中,所述根据所述第二特征对所述样本文件进行人工智能预测,包括:
根据所述第二特征提取所述样本文件的字符串特征;
利用预设预测模型对所述字符串特征进行预测,以识别所述样本文件是否为恶意文件。
在可能的实施例中,所述基于内存映射方式根据所述第一特征,获得经降维处理的第二特征包括:
获取映射关系表;
映射关系表包括第一特征与第二特征的位置指针之间的映射关系;
根据第二特征的位置指针,通过内存映射方式来确定所述第二特征。
在可能的实施例中,所述根据第二特征的位置指针,通过内存映射方式来确定所述第二特征包括:
对所述第二特征的位置指针进行指针偏移操作,获得偏移后的位置指针;
基于所述偏移后的位置指针,通过内存映射方式来确定所述第二特征。
在可能的实施例中,所述根据所述第二特征对所述样本文件进行人工智能预测的步骤之后,还包括:
在识别出所述样本文件为恶意文件时,加载家族分类模型到内存;
根据所述家族分类模型对所述样本文件进行病毒名分类,获得所述样本文件的病毒名分类结果。所述加载家族分类模型到内存为在识别出所述样本文件为恶意文件时,动态加载所述家族分类模型到内存,减少内存的占用,解决不进行病毒名分类时内存占用过高的技术问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深信服科技股份有限公司,未经深信服科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110146065.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种建筑幕墙喷涂用起吊装置
- 下一篇:一种编辑区块链中区块的方法及装置





