[发明专利]一种基于多维静态特征融合的Android诈骗软件检测方法在审
申请号: | 202211377608.7 | 申请日: | 2022-11-04 |
公开(公告)号: | CN116010948A | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 斯进;董齐芬;刘涛 | 申请(专利权)人: | 浙江警察学院 |
主分类号: | G06F21/56 | 分类号: | G06F21/56;G06F21/55 |
代理公司: | 杭州斯可睿专利事务所有限公司 33241 | 代理人: | 王利强 |
地址: | 310053 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多维 静态 特征 融合 android 诈骗 软件 检测 方法 | ||
一种基于多维静态特征融合的Android诈骗软件检测方法,包括以下步骤:步骤1:编写python文件,对Android软件进行特征提取;骤2:编写python文件,对Android软件特征进行预处理;步骤3:对数据集进行选择与分割对数据集进行选择与分割;步骤4:分别搭建DT、SVM、LR模型进行训练。本发明本发明提出了有效的检测方法,具有一定的实用性;提高了检测Android恶意软件的准确性。
技术领域
本发明属于安全领域,涉及一种基于多维静态特征融合的Android诈骗软件检测方法。
背景技术
为了提高用户的体验感,Android软件飞速发展,涉及人们生活的方方面面,同时也获取了更多的用户隐私信息,一旦这些隐私信息被不法分子用于威胁、敲诈,将对用户的财产安全造成严重的威胁。准确检测出诈骗软件,则可以在很大程度上保护用户的隐私数据及财产安全,为构建和谐社会增光添彩。
目前许多技术人员已经将深度学习的方法应用于自动高效的检测Android软件问题,很多软件设计者为了保护软件底层代码进行了加壳,因此加壳的类型也是一个重要的特征,同时很少有人将硬件特征融入数据集中。现有的检测方法存在有效性较差的不足。
发明内容
为了克服已有技术的不足,本发明提供了一种有效性较好的基于多维静态特征融合的Android诈骗软件检测方法,首先,利用python调用Android软件的逆向工具,从APK文件中获取加固、API、权限、硬件特征,生成one-hot编码后进行特征筛选,最后,训练的机器学习融合模型,在测试集中使用最佳训练模型对软件进行检测。本发明对Android智能手机的健康发展、构建和谐社会具有重大意义。
本发明解决其技术问题所采用的技术方案是:
一种基于多维静态特征融合的Android诈骗软件检测方法,包括以下步骤:
步骤1:编写python文件,对Android软件进行特征提取;
步骤2:编写python文件,对Android软件特征进行预处理,过程如下:
步骤2-1:将从步骤1中搜集的特征生成one-hot编码,即将每个Android软件特征转换为二进制向量;
步骤2-2:对步骤2-1中的特征进行筛选,降低数据维度;
步骤3:对数据集进行选择与分割,过程如下:
步骤3-1:将从步骤2-2中获得的数据集按照标签类型分成normal_data,malware_data;
步骤3-2:从normal_data、malware_data中分别进行同比列随机抽取,用于构建训练集(train_data)、验证集(validation_data)、测试集(test_data);
步骤4:分别搭建DT、SVM、LR模型进行训练,过程如下:
步骤4-1:分类精度的评价指标使用Accuracy与Error_rate表示:
式中,P代表正例总数、N代表负例总数;TP表示真实类别为正例,预测类别为正例;TN表示真实类别为负例,预测类别为负例;FP表示真实类别为负例,预测类别为正例;FN表示真实类别为正例,预测类别为负例;
步骤4-2:使用train_data对搭建的模型分别进行训练;
步骤4-3:在训练过程中,使用validation_data对模型进行验证,并保存最佳模型;
步骤4-4:根据三种模型的不同精度设置模型预测结果的投票权重,得到最终的融合模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江警察学院,未经浙江警察学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211377608.7/2.html,转载请声明来源钻瓜专利网。