[发明专利]文件安全性识别方法和装置在审
申请号: | 201610274067.3 | 申请日: | 2016-04-27 |
公开(公告)号: | CN107315955A | 公开(公告)日: | 2017-11-03 |
发明(设计)人: | 陈治宇;周吉文;郭疆;徐超 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F21/56 | 分类号: | G06F21/56;G06F15/18 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司11204 | 代理人: | 王达佐,马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文件 安全性 识别 方法 装置 | ||
技术领域
本申请涉及计算机领域,具体涉及安全技术领域,尤其涉及文件安全性识别方法和装置。
背景技术
随着互联网的快速发展,用户可下载的网络资源也越来越丰富。用户在需要安装某个应用时,仅需下载该应用的安装包文件,然后对应用进行安装即可。在这一过程中,确保用户下载的安装包文件是否安全是重中之重。目前,通常采用的检查安装包文件是否安全的方式为:预先提取病毒样本中的一些特征,然后,提取待识别文件中的与该特征相同类型的特征,当提取出的待识别文件中的特征与预先获取的病毒样本的特征匹配时,则判断为病毒文件。
然而,当采用上述方式检查安装包文件是否安全时,一方面,受到病毒样本个数的限制,难以全面覆盖所有的攻击类型,造成病毒文件的漏检。另一方面,病毒文件通常在短时间内通过个别特征的变化即可生成新的病毒文件,仅依靠预先提取的病毒文件的特征,无法对新生成的病毒文件进行识别。
发明内容
本申请提供了文件安全性识别方法和装置,用于解决上述背景技术部分存在的技术问题。
第一方面,本申请提供了文件安全性识别方法,该方法包括:获取待识别文件的特征信息;分别将特征信息中每一个类型的特征信息转换为特征信息对应的预设机器学习模型的输入向量,其中,每一个类型的特征信息预先对应一个机器学习模型;基于预设机器学习模型的输出向量,确定待识别文件是否为病毒文件。
第二方面,本申请提供了文件安全性识别装置,该装置包括:获取单元,配置用于获取待识别文件的特征信息;转换单元,配置用于分别将特征信息中每一个类型的特征信息转换为特征信息对应的预设机器学习模型的输入向量,其中,每一个类型的特征信息预先对应一个机器学习模型;确定单元,配置用于基于预设机器学习模型的输出向量,确定待识别文件是否为病毒文件。
本申请提供的文件安全性识别方法和装置,通过获取待识别文件的特征信息;分别将特征信息中每一个类型的特征信息转换为所述特征信息对应的预设机器学习模型的输入向量;基于预设机器学习模型的输出向量,确定待识别文件是否为病毒文件。实现了针对待识别文件的每一类型的特征,分别获取特征信息以及根据特征信息的特点分别创建机器学习模型进行训练和识别。一方面,较为全面地覆盖了病毒文件的特征,从而较为全面地对病毒文件进行识别。另一方面,通过对机器学习模型的训练使得机器学习模型确定病毒文件的模式,从而在病毒文件的特征进行变更时,依然可以根据病毒文件的模式识别出病毒文件,从而进一步提升文件安全性识别的适用性。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性系统架构图;
图2示出了根据本申请的文件安全性识别方法的一个实施例的流程图;
图3示出了根据本申请的文件安全性识别方法的另一个实施例的流程图;
图4示出了根据本申请的文件安全性识别方法的再一个实施例的流程图;
图5示出了适用于本申请中的文件安全性识别方法的一个示例性架构图;
图6示出了根据本申请的文件安全性识别装置的一个实施例的结 构示意图;
图7是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1示出了可以应用本申请的文件安全性识别方法或装置的实施例的示例性系统架构100。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供传输链路的介质。网络104可以包括各种连接类型,例如有线、无线传输链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯应用,例如、即时通讯类应用、浏览器类应用、搜索类应用、文字处理类应用等。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610274067.3/2.html,转载请声明来源钻瓜专利网。