[发明专利]二进制文件的分类方法、计算设备及存储介质在审
申请号: | 202210022273.0 | 申请日: | 2022-01-10 |
公开(公告)号: | CN114492366A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 杨晋 | 申请(专利权)人: | 阿里云计算有限公司 |
主分类号: | G06F40/194 | 分类号: | G06F40/194;G06K9/62;G06N3/04;G06N3/08;G06F21/56 |
代理公司: | 北京太合九思知识产权代理有限公司 11610 | 代理人: | 步文娟;张爱 |
地址: | 310012 浙江省*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 二进制文件 分类 方法 计算 设备 存储 介质 | ||
本申请实施例提供一种二进制文件的分类方法、计算设备及存储介质。在本申请实施例中,获取待分类二进制文件,获取待分类二进制文件中对应的可变化代码;确定可变化代码的代码特征,作为待分类二进制文件的文件特征;将待分类二进制文件的文件特征与预置的多个二进制文件类簇中的质心二进制文件的文件特征进行对比,确定待分类二进制文件所属类簇,从而确定待分类二进制文件所属类簇,所述质心二进制文件代表对应类簇的类簇特征。使得更加快速且准确地对二进制文件进行分类。
技术领域
本申请涉及计算机技术领域,尤其涉及一种二进制文件的分类方法、计算设备及存储介质。
背景技术
随着大数据和云计算技术的迅猛发展,伴随而来的网络安全局面日益复杂,在大数据海量文件的背景下,人工审计恶意代码已是捉襟见肘。而相比于文本文件,二进制文件因为缺少大量语义信息导致更加难以提取有效特征。且,二进制文件大小要远大于文本文件,在海量样本场景下如何快速分析一直是一个挑战性问题。
发明内容
本申请的多个方面提供一种二进制文件的分类方法、计算设备及存储介质,使得更加快速且准确地对二进制文件进行分类。
本申请实施例提供一种二进制文件的分类方法,包括:待分类二进制文件,获取所述待分类二进制文件中对应的可变化代码;确定所述可变化代码的代码特征,作为待分类二进制文件的文件特征;将所述待分类二进制文件的文件特征与预置的多个二进制文件类簇中的质心二进制文件的文件特征进行对比,确定所述待分类二进制文件所属类簇,从而确定待分类二进制文件的类簇,所述质心二进制文件代表对应类簇的类簇特征。
本申请实施例还提供一种计算设备,包括:存储器、处理器;所述存储器,用于存储计算机程序;所述处理器,执行所述计算机程序,以用于:获取待分类二进制文件,获取所述待分类二进制文件中对应的可变化代码;确定所述可变化代码的代码特征,作为待分类二进制文件的文件特征;将所述待分类二进制文件的文件特征与预置的多个二进制文件类簇中的质心二进制文件的文件特征进行对比,确定所述待分类二进制文件所属类簇,从而确定待分类二进制文件的类簇,所述质心二进制文件代表对应类簇的类簇特征。
本申请实施例还提供一种存储有计算机程序的计算机可读存储介质,计算机程序被一个或多个处理器执行时,致使所述一个或多个处理器实现上述方法中的步骤。
在本申请实施例中,获取待分类二进制文件,获取待分类二进制文件中对应的可变化代码;确定可变化代码的代码特征,作为待分类二进制文件的文件特征;将待分类二进制文件的文件特征与预置的多个二进制文件类簇中的质心二进制文件的文件特征进行对比,确定待分类二进制文件所属类簇,从而确定待分类二进制文件的类簇,质心二进制文件代表对应类簇的类簇特征。
其中,获取待分类二进制文件,获取待分类二进制文件中对应的可变化代码,可以剔除掉不必要的信息,使得更有针对性地针对可变化代码进行较为准确且快速的分类,以及代码的识别。
将文件特征与预置的多个二进制文件类簇中的质心二进制文件的文件特征进行对比,确定待分类二进制文件所属类簇,从而确定待分类二进制文件的类簇,从而使得以自动化的方式对二进制文件进行分类以及识别。且分类以及识别的速度和准确率都得到了大大的提升。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1为本申请一示例性实施例的二进制文件的分类方法的流程示意图;
图2为本申请一示例性实施例的二进制文件的分类的过程的示意图;
图3为本申请一示例性实施例的二进制文件的分类系统的结构示意图;
图4为本申请一示例性实施例提供的二进制文件的分类装置的结构示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里云计算有限公司,未经阿里云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210022273.0/2.html,转载请声明来源钻瓜专利网。