[发明专利]确定小程序特征向量的方法、装置和电子设备有效
| 申请号: | 202010334290.9 | 申请日: | 2020-04-24 |
| 公开(公告)号: | CN111241496B | 公开(公告)日: | 2021-06-29 |
| 发明(设计)人: | 郑黄成;欧阳瑜;李佳佳 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06F21/12 | 分类号: | G06F21/12;G06F21/56 |
| 代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
| 地址: | 310007 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 确定 程序 特征向量 方法 装置 电子设备 | ||
1.一种确定小程序特征向量的方法,其中,所述方法包括:
在小程序的程序数据中按序抽取多个特征字符串,其中,所述程序数据包括所述小程序的包文件结构、所述小程序的静态代码文件和所述小程序的动态运行数据;
根据所述多个特征字符串生成所述小程序的特征字符串序列;
将所述小程序的特征字符串序列转换为特征字符串向量;
将所述特征字符串向量输入到训练好的深度学习模型中,以生成所述小程序的特征向量,其中,所述深度学习模型为编码-解码模型中用于编码的编码模型;
所述方法还包括:
根据所述小程序的特征向量与多个其他小程序的特征向量,确定所述小程序分别与所述多个其他小程序的多个相似度;
基于所述多个相似度,对所述多个其他小程序进行排序;
根据所述排序中预设数量的小程序中恶意小程序的数量,确定所述小程序是否为恶意小程序;
在将所述特征字符串向量输入到训练好的深度学习模型中,以生成所述小程序的特征向量之前,所述方法还包括:
使用多个训练向量训练编码解码模型,其中,每个所述训练向量为一个小程序的所述特征字符串向量,所述编码解码模型包括编码模型和解码模型,所述编码模型用于对所述特征字符串向量进行编码得到所述特征向量,所述解码模型用于将所述特征向量进行解码得到输出向量,训练所述编码解码模型的优化目标为减小根据所述输出向量和所述训练向量计算得到的损失值;
确定达到训练收敛条件,以得到训练好的所述编码模型。
2.根据权利要求1所述的方法,其中,所述将所述小程序的特征字符串序列转换为特征字符串向量,包括:
根据预设索引映射表中字符串与数字索引码之间的映射关系,将所述特征字符串序列中的每个所述特征字符串替换为对应的数字索引码,以得到所述特征字符串向量。
3.根据权利要求1所述的方法,其中,在所述程序数据包括多个种类的情况下,所述根据所述多个特征字符串生成所述小程序的特征字符串序列,包括:
分别在每个种类的程序数据对应的特征字符串中,抽取不超过预设数量的特征字符串;
组合抽取出的特征字符串,以得到所述特征字符串序列。
4.根据权利要求1-3任一项所述的方法,其中,所述程序数据包括所述小程序的包文件结构,所述在小程序的程序数据中按序抽取多个特征字符串,包括:
按照所述包文件结构的结构顺序,抽取每个文件的文件名和文件类型后缀,以得到每个文件的文件名特征字符串,其中,每个所述文件名特征字符串包括对应文件的文件名和文件类型后缀。
5.根据权利要求4所述的方法,其中,所述根据所述多个特征字符串生成所述小程序的特征字符串序列,包括:
在根据所述包文件结构得到的所述文件名特征字符串中,抽取目标文件类型后缀的字符串,以得到对应于所述包文件结构的特征字符串;
根据抽取出的字符串生成所述特征字符串序列。
6.根据权利要求1-3任一项所述的方法,其中,所述程序数据包括所述小程序的静态代码文件,所述在小程序的程序数据中按序抽取多个特征字符串,包括:
在所述小程序的静态代码文件中,选取多个目标代码文件;
在每个所述目标代码文件中匹配预设正则表达式,其中,所述预设正则表达式包括一个或多个目标字符串以及每个所述目标字符串的匹配规则;
将每个命中的代码片段拆分为多个字符串,得到所述多个特征字符串。
7.根据权利要求1-3任一项所述的方法,其中,所述程序数据包括所述小程序的动态运行数据,所述在小程序的程序数据中按序抽取多个特征字符串,包括:
运行所述小程序;
抓取所述小程序运行过程中产生的请求;
在所述请求中匹配预设字符串,其中,每个所述预设字符串用于表示所述请求中携带的一种信息的名称;
拆分命中的请求,得到所述多个特征字符串。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010334290.9/1.html,转载请声明来源钻瓜专利网。





