[发明专利]文件安全性识别方法和装置在审
申请号: | 201610274067.3 | 申请日: | 2016-04-27 |
公开(公告)号: | CN107315955A | 公开(公告)日: | 2017-11-03 |
发明(设计)人: | 陈治宇;周吉文;郭疆;徐超 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F21/56 | 分类号: | G06F21/56;G06F15/18 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司11204 | 代理人: | 王达佐,马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件 安全性 识别 方法 装置 | ||
1.一种文件安全性识别方法,其特征在于,所述方法包括:
获取待识别文件的特征信息;
分别将所述特征信息中每一个类型的特征信息转换为所述特征信息对应的预设机器学习模型的输入向量,其中,每一个类型的特征信息预先对应一个机器学习模型;
基于所述预设机器学习模型的输出向量,确定待识别文件是否为病毒文件。
2.根据权利要求1所述的方法,其特征在于,所述待识别文件为安卓安装包Apk文件,所述特征信息包括Apk文件的结构特征信息;以及
获取待识别文件的特征信息包括:
将确定出的Apk文件中名称的长度小于阈值的包的个数作为结构特征信息;
将统计出的Apk文件中的类的名称的长度的最大值、最小值、总和值、平均值、方差值、类的个数与Apk文件中的所有类的个数的比例作为结构特征信息;
将统计出的Apk文件中的成员变量的名称的长度的最大值、最小值、平均值、方差值、成员变量的个数与Apk文件中的所有成员变量的个数的比例作为结构特征信息;
将统计出的Apk文件中的成员函数的名称的长度的最大值、最小值、总和值、平均值、方差值、成员函数的个数与Apk文件中的所有成员函数的个数中所占的比例作为结构特征信息;
将统计出的Apk文件中成员变量的类型、成员函数的返回值的类型与Apk文件中所有数据的类型的比例作为结构特征信息;
将统计出的Apk文件中成员函数的输入参数的个数的分布、输入参数的名称的长度小于阈值的参数的个数作为结构特征信息;
将判断Apk文件中是否存在预设字符串、url、电话号码、数字而 得到的判断结果作为结构特征信息;
将统计出的Apk文件中的窗口的个数、窗口的名称的长度的最大值、最小值、总和值、平均值、方差值、窗口的尺寸作为结构特征信息;
将统计出的Apk文件中的菜单的个数、菜单的名称的长度的最大值、最小值、总和值、平均值、方差值作为结构特征信息;
将统计出的Apk文件中动画的个数、动画的名称的长度的最大值、最小值、总和值、平均值、方差值和获取到的动画中的图像的像素特征作为结构特征信息;
将统计出的Apk文件中图片的个数、图片的名称的长度的最大值、最小值、总和值、平均值、方差值和获取到的图片中的图像的像素特征作为结构特征信息;以及
分别将所述特征信息中每一个类型的特征信息转换为所述特征信息对应的预设机器学习模型的输入向量包括:
将所述结构特征信息转换为预设定长输入的机器学习模型的输入向量,其中,每一个类型的结构特征信息对应所述输入向量中的一个分量。
3.根据权利要求2所述的方法,其特征在于,所述待识别文件为安卓安装包Apk文件,所述特征信息包括函数特征信息;以及
获取待识别文件的特征信息包括:
生成Apk文件对应的函数森林,其中,函数森林中包含多个节点,每一个节点对应Apk文件中的一个函数;
对函数森林中的树的长度进行排序,确定排序之后排名在预设名次之前的树;
采用深度优先算法遍历所述树中预设深度之上的节点;
将所述节点对应的函数的名称或函数中的指令作为函数特征信息;
将采用相似度哈希算法计算出的所述函数名称或函数中的指令对应的哈希值作为函数特征信息;以及
分别将所述特征信息中每一个类型的特征信息转换为所述特征信息对应的预设机器学习模型的输入向量包括:
将所述哈希值转换为预设变长输入的机器学习模型的输入向量。
4.根据权利要求3所述的方法,其特征在于,所述待识别文件为安卓安装包Apk文件,特征信息包括权限特征信息;以及
获取待识别文件的特征信息包括:
判断Apk文件中是否包含预设权限;
基于判断结果,生成权限特征信息;以及
分别将所述特征信息中每一个类型的特征信息转换为所述特征信息对应的预设机器学习模型的输入向量包括:
将所述权限特征信息转换为预设定长输入的机器学习模型的输入向量,其中,所述预设权限对应的分量的数值为1,除所述预设权限对应的分量之外的分量的数值为0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610274067.3/1.html,转载请声明来源钻瓜专利网。