[发明专利]一种识别异常APK的方法、电子设备及可读存储介质在审
申请号: | 202111090867.7 | 申请日: | 2021-09-17 |
公开(公告)号: | CN114168155A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 尹祖勇;吕繁荣;俞锋锋;张雅茹;钟杨青 | 申请(专利权)人: | 杭州云深科技有限公司 |
主分类号: | G06F8/53 | 分类号: | G06F8/53;G06F8/70 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 原春香 |
地址: | 310030 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 异常 apk 方法 电子设备 可读 存储 介质 | ||
1.一种识别异常APK的方法,其特征在于,所述方法包括如下步骤:
S101、获取目标APK列表A=(A1,A2,A3,……,Am),其中,Ai是指第i个目标APK,m为目标APK数量;
S103、根据A对应的目标文件D,得到第一目标列表B=(B1,B2,B3,……,Bλ)和第二目标列表其中,Bx是指第X个第一目标词,x=1……λ,λ为第一目标词数量,是指第y个第二目标词,y=1……γ,γ为第二目标词数量;
其中,S103还包括如下方法确定D:
将Ai进行反编译处理,得到目标代码包,所述目标代码包包括:若干个的目标文件,所述目标文件是指若干行的编辑代码;
将任一行的编辑代码提取的中文语料作为目标语句,并对相邻行的目标语句之间插入间隔符且对相邻的目标文件之间插入相同的间隔符,得到Di;
当D1∪D2∪……∪Dm时且相邻的Di插入相同的间隔符,得到D;
S105、根据B和得到目标词列表C=(C1,C2,C3,……,Cn)并存储至样本数据库,其中,Cj是指第j个样本关键词,j=1……n,n为样本关键数量;
S107、将任一Cj输入至LDA模型,得到Cj对应的词向量(Cj1,Cj2,Cj3,……,Cjk)并存储至所述样本数据库,其中,Cjt是指Cj对应的第t个关联词,t=1……k,k为关联词数量;
S109、基于所述样本数据库,确定待测APK是否为异常APK。
2.根据权利要求1所述的一种识别异常APK的方法,其特征在于,所述目标APK为具有异常标识的APK。
3.根据权利要求2所述的一种识别异常APK的方法,其特征在于,A1……Am具有相同的异常标识。
4.根据权利要求1所述的一种识别异常APK的方法,其特征在于,所述目标语句包括单个字字、单个词组和一段语句中一种或者多种组合。
5.根据权利要求1所述的一种识别异常APK的方法,其特征在于,所述间隔符可以问停用词库中任一停用词。
6.根据权利要求1所述的一种识别异常APK的方法,其特征在于,所述方法还如下方法确定B:
将D进行切词处理和去重处理,得到第一关键词列表T=(T1,T2,T3,……,Tp)和T对应的TF值列表S=(S1,S2,S3,……,Sp),Tα是指第α个第一关键词且Sα是指Tα对应的TF值,α=1……p,p为第一关键词数量,其中,S1≥S2≥S3≥……≥Sp;
初始化B=Null遍历S;
当α≤预设的序号阈值,将Tα插入至B。
7.根据权利要求1或6所述的一种识别异常APK的方法,其特征在于,所述方法还包括如下方法确定
将相同的D进行切词处理和去重处理,得到第二关键词列表和对应的textrank值列表是指第β第二关键词且是指对应的textrank值,β=1……q,q为第二关键词数量,其中,
初始化且遍历
当β≤所述序号阈值,将插入至
8.根据权利要求1所述的一种识别异常APK的方法,其特征在于,所述方法还包括如如下方法确定C:
初始化C=Null且遍历B和
当时,将Bx插入至C。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州云深科技有限公司,未经杭州云深科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111090867.7/1.html,转载请声明来源钻瓜专利网。