[发明专利]一种识别异常APK的方法、电子设备及可读存储介质在审
申请号: | 202111090867.7 | 申请日: | 2021-09-17 |
公开(公告)号: | CN114168155A | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 尹祖勇;吕繁荣;俞锋锋;张雅茹;钟杨青 | 申请(专利权)人: | 杭州云深科技有限公司 |
主分类号: | G06F8/53 | 分类号: | G06F8/53;G06F8/70 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 原春香 |
地址: | 310030 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 识别 异常 apk 方法 电子设备 可读 存储 介质 | ||
本发明公开了一种识别异常APK的方法、电子设备及可读存储介质,所述方法包括如下步骤:通过获取目标APK列表,根据目标APK列表中APK反编译得到的文件得到第一目标词列表和第二目标词列表,根据一目标关键词列表和第二目标词列表,得到目标词列表并存储至样本数据库;将目标词列表任一目标词输入至第三模型,得到此目标词进行扩充得到扩充后的词向量并存储至所述样本数据库;基于所述样本数据库,确定待测APK是否为异常APK;发明的技术方案中能够保证样本数据库的中数据充足和完善,有利于提高确定异常APK的准确性,同时也优化了本数据库的中数据。
技术领域
本发明涉及APK文件技术领域,特别涉及一种识别异常APK的方法、电 子设备及可读存储介质。
背景技术
目前,安卓平台中针对安卓安装包(AndroidPackage,简称APK)具有很多的 类型,其中异常类型的APK会对于用户产生负面效果,例如,泄漏用户信息或 者插入异常插件等。
在现有的技术中,对于安装在设备中的APK,统计的异常APK有限,一方 面是由于APK加密无法进行识别,另一方面由于,异常APK会不断的更新, 数据库中无法满足更新后的APK识别,对用户使用造成负面鲜果,影响到用户 的使用安全。
发明内容
为了解决现有技术的问题,通过计算出任一APK反编译得到的文本中关键 对应的TF值和textrank值,并基于TF值和textrank值筛选出目标词用于扩展若 干关联词,将关联词和目标词存储值样本数据库中,保证样本数据库的中数据 充足和完善,有利于提高确定异常APK的准确性,同时也优化了本数据库的中 数据;本发明实施例提供了一种识别异常APK的方法、电子设备及可读存储介 质。所述技术方案如下:
一方面,一种识别异常APK的方法,所述方法包括如下步骤:
S101、获取目标APK列表A=(A1,A2,A3,……,Am),其中,Ai是指 第i个目标APK,m为目标APK数量;
S103、根据A对应的目标文件D,得到第一目标列表B=(B1,B2,B3,……, Bλ)和第二目标列表其中,Bx是指 第X个第一目标词,x=1……λ,λ为第一目标词数量,是指第y个第二目 标词,y=1……γ,γ为第二目标词数量;
其中,S103还包括如下方法确定D:
将Ai进行反编译处理,得到目标代码包,所述目标代码包包括:若干个的 目标文件,所述目标文件是指若干行的编辑代码;
将任一行的编辑代码提取的中文语料作为目标语句,并对相邻行的目标语 句之间插入间隔符且对相邻的目标文件之间插入相同的间隔符,得到Di;
当D1∪D2∪……∪Dm时且相邻的Di插入相同的间隔符,得到D;
S105、根据B和得到目标词列表C=(C1,C2,C3,……,Cn)并存 储至样本数据库,其中,Cj是指第j个样本关键词,j=1……n,n为样本关键数 量;
S107、将任一Cj输入至LDA模型,得到Cj对应的词向量(Cj1,C2,Cj3,……,Cjk)并存储至所述样本数据库,其中,Cjt是指Cj对应的第t个关联词,t=1…… k,k为关联词数量;
S109、基于所述样本数据库,确定待测APK是否为异常APK。
另一方面,一种电子设备,包括处理器和存储器,所述存储器中存储有至 少一条指令或至少一段程序,所述至少一条指令或所述至少一段程序由所述处 理器加载并执行以实现如上述任一项所述识别异常APK的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州云深科技有限公司,未经杭州云深科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111090867.7/2.html,转载请声明来源钻瓜专利网。