[发明专利]一种android恶意软件的静态检测方法、系统及介质有效

专利信息
申请号: 201911135061.8 申请日: 2019-11-19
公开(公告)号: CN110990834B 公开(公告)日: 2022-12-27
发明(设计)人: 龙昭华;杨宗靖;乔焕宇 申请(专利权)人: 重庆邮电大学
主分类号: G06F21/56 分类号: G06F21/56;G06K9/62
代理公司: 重庆市恒信知识产权代理有限公司 50102 代理人: 刘小红;陈栋梁
地址: 400065 重*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 android 恶意 软件 静态 检测 方法 系统 介质
【权利要求书】:

1.一种android恶意软件的静态检测方法,其特征在于,包括以下步骤:

步骤1、对获取的Android应用程序进行逆向得到数据集,再对数据集进行样本分析,提取数据集中明显存在风险的数据;

步骤2、提取AndroidManifest文件中的exported属性值、debuggable属性值和allowBackup属性值,采用基于词频算法对属性值进行计算;

步骤3、提取AndroidManifest文件中的权限属性和smali文件中的API属性,采用相关性计算方法,首先去除与类别不相关的属性,然后采用余弦相似度和杰卡德系数对各类别属性进行分别处理并去取出共同属性,最后融合各类别特征,得到融合后的特征集;

步骤4、最后对处理后的特征集进行归一化处理,构建支持向量机分类器,将测试样本集放入分类器中,检测是否是Android恶意程序,再通过对测试样本集在智能代理模型中得到的结果和分类器模型得到的最终结果进行比较,将分类器得到的结果反馈给智能代理模型,动态的改进智能代理模型;

在步骤2中采用基于词频算法对该属性值进行计算具体包括:

首先对AndroidManifest文件中的组件activity、service、provider、receiver以及application标签中exported属性值、debuggable属性值和allowBackup属性值为true的进行统计,若组件中没有exported属性,却存在action属性,同样认定该标签为true,并将该规则加入到智能代理模型中,该模型计算处理规则如下:

其中Ni,j为一个Android应用程序Aj使用特定风险属性的次数,Mj是Aj中组件的总个数,TFi,j是该词出现的频率;

得到词频集γ={TF1,j,TF2,j...TFi,j...TFn,j},然后进行拉普拉斯平滑处理,处理完后将γ通过最小值和最大值划分为3等份,则每个区间的长度为

其中X,Y为γ中的最小值和最大值,则区间的边界为X+W,X+2W,进而将样本集从小到大分为三类集合XLR、XHR和XMR

2.根据权利要求1所述的一种android恶意软件的静态检测方法,其特征在于,所述步骤1对获取的Android应用程序进行逆向得到数据集,再对数据集进行样本分析,具体包括:

对下载的Android良性应用程序和恶意应用程序使用apktool工具进行逆向,提取其中smali文件和AndroidManifest文件,对得到的属性集按类别储存。

3.根据权利要求1所述的一种android恶意软件的静态检测方法,其特征在于,所述步骤3中相关性计算方法具体包括:

通过点二列相关系数去除Android程序中不相关的属性,首先计算属性与类别的相关系数

其中S是数据集的标准偏差,是良性样本集中所有数据点的Xp的平均值,是恶意样本集中所有数据点Xq的平均值,Pp是总样本集中Xp出现的概率,Pq是总样本集中Xq出现的概率,将带入相关系数计算,得到rpb,根据相关系数的值判别属性与相关系数的大小,去除不相关属性。

4.根据权利要求3所述的一种android恶意软件的静态检测方法,其特征在于,步骤4通过序列前项选择算法对融合后的特征集进行处理并通过归一化得到最优特征集,构建支持向量机分类器;

其中序列前项选择是通过构建一个空的特征集R,每次从特征子集中选择一个特征M加入到R中,使得评价函数的效果最优。

5.一种存储介质,该存储介质内部存储计算机程序,其特征在于,所述计算机程序被处理器读取时,执行所述权利要求1~4任一项的方法。

6.一种android恶意软件的静态检测系统,其特征在于,包括:

反编译模块:用于下载获取Android良性应用程序和恶意应用程序,并创建成样本库放入到智能代理模型中,通过逆向工程技术对获取的良性应用和恶意应用分别进行反编译,得到smali文件和AndroidManifest文件;

词频计算模块:提取AndroidManifest文件中的exported属性值、debuggable属性值和allowBackup属性值,采用基于词频算法对该属性值进行计算;

特征融合模块:提取AndroidManifest文件中的权限属性和smali文件中的API属性,采用相关性计算方法,首先去除与类别不相关的属性,然后对采用多种特征选择算法对各类别属性进行分别处理并去取出共同属性,最后融合各类别特征,得到融合后的特征集;

检测模块:用于对处理后的特征集进行归一化处理,构建支持向量机分类器,将测试样本集放入分类器中,检测是否是Android恶意程序,再通过对测试样本集在智能代理模型中得到的结果和分类器模型得到的最终结果进行比较,将分类器得到的结果反馈给智能代理模型,动态的改进智能代理模型;中采用基于词频算法对该属性值进行计算具体包括:

首先对AndroidManifest文件中的组件activity、service、provider、receiver以及application标签中exported属性值、debuggable属性值和allowBackup属性值为true的进行统计,若组件中没有exported属性,却存在action属性,同样认定该标签为true,并将该规则加入到智能代理模型中,该模型计算处理规则如下:

其中Ni,j为一个Android应用程序Aj使用特定风险属性的次数,Mj是Aj中组件的总个数,TFi,j是该词出现的频率;

得到词频集γ={TF1,j,TF2,j...TFi,j...TFn,j},然后进行拉普拉斯平滑处理,处理完后将γ通过最小值和最大值划分为3等份,则每个区间的长度为

其中X,Y为γ中的最小值和最大值,则区间的边界为X+W,X+2W,进而将样本集从小到大分为三类集合XLR、XHR和XMR

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911135061.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top