[发明专利]一种Android系统恶意软件检测中动静混合特征提取方法在审
| 申请号: | 202011583878.4 | 申请日: | 2020-12-28 |
| 公开(公告)号: | CN112632539A | 公开(公告)日: | 2021-04-09 |
| 发明(设计)人: | 姚烨;钱亮;贾耀;朱怡安;杜家伟;牛军涛 | 申请(专利权)人: | 西北工业大学 |
| 主分类号: | G06F21/56 | 分类号: | G06F21/56;G06K9/62 |
| 代理公司: | 西北工业大学专利中心 61204 | 代理人: | 金凤 |
| 地址: | 710072 *** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 android 系统 恶意 软件 检测 动静 混合 特征 提取 方法 | ||
本发明提供了一种Android系统恶意软件检测中动静混合特征提取方法,在静态数据集的基础上,基于CHI统计方法筛选并搭建高危权限和敏感API库;根据高危权限和敏感API,利用反编译手段分析、筛选得到基于静态数据集的静态特征;将APK文件运行在搭建了开源框架Xposed的Android模拟器上,通过Hook系统敏感API和监控系统运行状态信息,得到基于敏感API调用和系统运行状态的动态特征;组合静态特征和动态特征为最终的动静混合特征。本发明所提方法兼顾静态和动态特征,利用低维特征数据尽可能多的描述恶意软件的综合恶意特征,对Android恶意软件具有良好的检测准确率。
技术领域
本发明涉及特征提取领域,尤其是一种用于Android恶意软件检测的动静混合特征提取方法。
背景技术
针对Android恶意软件的检测工作,既依赖于分类器的优劣程度,更依赖于用于分类的特征向量能否最大程度地反映出恶意软件的全部特征信息。目前,研究者们对于Android恶意软件的特征提取工作,并未做深入研究。如董庆宽等人的发明方法中只通过获取应用程序运行时trace文件来获取特征,未考虑静态特征对于恶意软件检测结果的影响;谢丽霞等人只通过静态数据集筛选出静态特征子集,再得到分类器对应的最优子集,未考虑动态特征对于恶意软件检测结果的影响。
发明内容
为了克服现有技术的不足,本发明提供一种Android系统恶意软件检测中动静混合特征提取方法。在静态数据集的基础上,基于CHI统计方法筛选并搭建高危权限和敏感API库;根据高危权限和敏感API,利用反编译手段分析、筛选得到基于静态数据集的静态特征;将APK文件运行在搭建了开源框架Xposed的Android模拟器上,通过Hook系统敏感API和监控系统运行状态信息,得到基于敏感API调用和系统运行状态的动态特征;组合静态特征和动态特征为最终的动静混合特征。
本发明解决其技术问题所采用的技术方案是:
步骤一:基于CHI统计方法筛选高危权限;
基于CHI统计方法筛选高危权限,具体流程如下:
(1)选取N个样本,包含恶意样本NK个和正常样本个,且满足
(2)选取Android系统的所有权限作为权限集P={p1,p2,...,pM};
(3)对于权限pi∈P(i=1,2,...,M):
表1权限样本分组
计算权限pi的CHI值:
其中,N=A+B+C+D,A表示属于类别K且含有权限pi的样本数,B表示属于类别K但不含权限pi的样本数,C表示不属于类别K但含有权限pi的样本数,D表示不属于类别K且不含权限pi样本数;
(4)由于CHI值越高,表示权限pi与恶意性的相关程度越高。因此,按照CHI值从大到小排序,选取高危权限列表如表2所示:
表2高危权限列表
步骤二:基于凝聚层次和K-Means结合方法去除权限之间相关性
Android部分权限之间存在较强的相关性,若同时选取具有明显相关性的权限作为特征,则对分类结果产生显著影响;
K-Means聚类算法快速处理大量数据,但是不能自动寻找最优聚类的类别数量,从而导致结果质量的不稳定性;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011583878.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种全自动香菇烘干设备
- 下一篇:数据处理方法、装置、终端设备及存储介质





