[发明专利]一种基于多模态融合的诈骗APP的识别方法及系统在审
| 申请号: | 202310250685.4 | 申请日: | 2023-03-15 |
| 公开(公告)号: | CN116225950A | 公开(公告)日: | 2023-06-06 |
| 发明(设计)人: | 罗峰;卢永强;谢东岳 | 申请(专利权)人: | 北京赋乐科技有限公司 |
| 主分类号: | G06F11/36 | 分类号: | G06F11/36;G06F8/53 |
| 代理公司: | 北京麦汇智云知识产权代理有限公司 11754 | 代理人: | 何平 |
| 地址: | 100080 北京市海淀区温泉*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 多模态 融合 诈骗 app 识别 方法 系统 | ||
1.一种基于多模态融合的诈骗APP的识别方法,其特征在于,包括以下步骤:
获取待测软件的APK文件;
基于所述APK文件提取基础元数据特征,得到元数据特征;
将所述APK文件在真机中运行,并获取注册界面截图,通过图片分类算法提取注册界面截图的语义特征,得到待测软件的注册语义特征;
将所述APK文件在真机中运行,并获取登录界面截图,通过图片分类算法提取登录界面截图的语义特征,得到待测软件的登录语义特征;
将所述APK文件进行反编译,得到对应的源代码,并通过自然语言处理算法提取开发类型特征,得到待测软件的开发类型特征;
将元数据特征、注册语义特征、登录语义特征和开发类型特征中的所有特征进行划分为连续类特征和离散类特征,并基于划分结果分别送入DeepWide模型中进行研判处理,得到最终融合特征以及特征挖掘信息;
基于最终融合特征判断待测软件是否涉嫌诈骗,得到诈骗预测结果信息。
2.如权利要求1所述的一种基于多模态融合的诈骗APP的识别方法,其特征在于,所述将所述APK文件进行反编译,得到对应的源代码,并通过自然语言处理算法提取开发类型特征,得到待测软件的开发类型特征的步骤具体包括:
通过逆向提取模型,对所述APK文件进行逆推,还原所述APK文件的源代码,得到对应的源代码信息;
对源代码信息进行数据预处理,并对预处理后的源代码信息进行拼接为程序可读的文本数据,得到文本形式数据;
将文本形式数据送入BERT模型进行特征提取,得到待测软件的开发类型特征。
3.如权利要求1所述的一种基于多模态融合的诈骗APP的识别方法,其特征在于,所述元数据特征包括包名长度、包名字母的数量、包名数字的数量、文件大小、签名长度、APP文本命中关键词数量、APP网络交互域名数量、APP网络交互境外域名数量或APP网络交互境内域名数量中的至少一个。
4.如权利要求1所述的一种基于多模态融合的诈骗APP的识别方法,其特征在于,所述注册语义特征包括手机注册、邮箱注册、用户名注册、邀请码注册、验证码注册、无注册、人脸验证、验证码验证、密码二次验证、无验证、有政策条款和无政策条款中的至少一种。
5.如权利要求1所述的一种基于多模态融合的诈骗APP的识别方法,其特征在于,所述登录语义特征包括刷脸登录、验证码登录、手机号登录、身份证登录、其他网络账号快捷登录、无其他网络账号快捷登录、邀请码登录、需验证码、无需验证码、密码报错提醒或无密码错误提醒中的至少一种。
6.一种基于多模态融合的诈骗APP的识别系统,其特征在于,包括:
安装包获取模块,用于获取待测软件的APK文件;
元数据提取模块,用于基于所述APK文件提取基础元数据特征,得到元数据特征;
注册语义提取模块,用于将所述APK文件在真机中运行,并获取注册界面截图,通过图片分类算法提取注册界面截图的语义特征,得到待测软件的注册语义特征;
登录语义提取模块,用于将所述APK文件在真机中运行,并获取登录界面截图,通过图片分类算法提取登录界面截图的语义特征,得到待测软件的登录语义特征;
开发类型提取模块,用于将所述APK文件进行反编译,得到对应的源代码,并通过自然语言处理算法提取开发类型特征,得到待测软件的开发类型特征;
研判处理,用于将元数据特征、注册语义特征、登录语义特征和开发类型特征中的所有特征进行划分为连续类特征和离散类特征,并基于划分结果分别送入DeepWide模型中进行研判处理,得到最终融合特征以及特征挖掘信息;
预测识别模块,用于基于最终融合特征以及特征挖掘信息判断待测软件是否涉嫌诈骗,得到诈骗预测结果信息。
7.一种电子设备,其特征在于,包括至少一个处理器、至少一个存储器和数据总线;其中:所述处理器与所述存储器通过所述数据总线完成相互间的通信;所述存储器存储有被所述处理器执行的程序指令,所述处理器调用所述程序指令以执行如权利要求1-5任一项所述的方法。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-5中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京赋乐科技有限公司,未经北京赋乐科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310250685.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种面向智慧小区的多能融合系统协调控制方法
- 下一篇:正压式防护头套装置





