[发明专利]应用程序的特征提取方法和装置以及分类方法和装置在审
申请号: | 201911375588.8 | 申请日: | 2019-12-27 |
公开(公告)号: | CN113051561A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 赵新歌;殷铭;闻剑峰 | 申请(专利权)人: | 中国电信股份有限公司 |
主分类号: | G06F21/56 | 分类号: | G06F21/56 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 曹瑾 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 应用程序 特征 提取 方法 装置 以及 分类 | ||
本发明的一个方面涉及应用程序的特征提取方法和装置。具体公开了一种应用程序的特征提取方法,包括:从应用程序的样本获得应用程序的代码文件;以及通过分析所述代码文件来提取应用程序的动态特征信息,所述动态特征信息为仿真应用程序运行时的应用程序接口(API)调用序列。
技术领域
本发明涉及应用程序(APP)的分类检测领域,具体涉及APP的特征提取。
背景技术
目前的恶意APP的检测方法主要基于分类算法,而分类算法的有效性和准确性与所提取的APP样本的特征所携带的信息量密不可分。特征的提取方式包括静态分析和动态分析两种手段。静态分析通过对恶意APP的样本的代码进行分析来提取基于签名的描述符和字符串特征。而动态分析基于沙箱运行恶意APP样本,并记录恶意APP样本运行期间的行为特征数据,例如应用程序接口(API)调用序列。
在得到静态特征和动态特征之后,需对其进行编码。编码对分类模型的选择和准确性也有重要影响。传统的检测方法通常对API调用序列采用独热(one-hot)编码。经编码的特征被输入分类模块进行分类。
发明内容
传统的恶意APP检测方法存在一些问题。首先,APP的安卓应用程序包(Androidapplication package,apk)存在多个版本。在基于沙箱运行APP进行动态分析时,为了适应不同版本的apk运行要求,需配备多个版本的安卓操作系统(android OS)的模拟器。并且,在基于沙箱运行APP时容易受到恶意APP的反侦察技术影响。恶意软件在检测到沙箱后刻意规避恶意代码运行,从而导致代码覆盖率不高。此外,传统的检测方法所使用的one-hot编码不考虑元素与元素之间的顺序,难以准确表达上下文信息;并且容易维度极速上升,导致维数灾难问题。
为了解决上述技术问题,根据本发明的一个方面,提供了一种应用程序的特征提取方法,包括:从应用程序的样本获得应用程序的代码文件;以及通过分析所述代码文件来提取应用程序的动态特征信息,所述动态特征信息为仿真应用程序运行时的应用程序接口(API)调用序列。
根据本发明的另一个方面,提供了一种应用程序的分类方法,包括:从应用程序样本中提取静态特征信息和动态特征信息,其中所述动态特征信息是根据如上所述的特征提取方法提取的;以及将静态特征信息和动态特征信息输入分类模型以检测特定类别的应用程序。
根据本发明的另一方面,提供了一种用于应用程序的特征提取的计算机实现的装置,包括:存储器;以及处理器,所述处理器被配置为当执行存储在所述存储器中的指令时,使得所述装置实现如上所述的特征提取方法。
根据本发明的另一方面,提供了一种用于应用程序的分类的计算机实现的装置,包括:存储器;以及处理器,所述处理器被配置为当执行存储在所述存储器中的指令时,使得所述装置实现如上所述的分类方法。
根据本发明的另一方面,提供了一种非瞬态计算机可读存储介质,存储有指令,所述指令当被计算设备的处理器执行时使得所述计算设备实现如上所述的特征提取方法。
根据本发明的另一方面,提供了一种非瞬态计算机可读存储介质,存储有指令,所述指令当被计算设备的处理器执行时使得所述计算设备实现如上所述的分类方法。
附图说明
参照附图,根据下面的详细描述,可以更清楚地理解本公开,其中:
图1示出了根据本发明一个实施例的APP的特征提取方法的流程图;
图2示出了根据本发明一个实施例的图1所示的分析代码文件的步骤的详细流程图;
图3示出了根据本发明一个实施例的APP的分类方法的流程图;以及
图4示出了现有技术方法的架构与本发明方法的架构的对比。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911375588.8/2.html,转载请声明来源钻瓜专利网。