[发明专利]一种病毒文件识别方法在审
申请号: | 201811306629.3 | 申请日: | 2018-11-05 |
公开(公告)号: | CN109670305A | 公开(公告)日: | 2019-04-23 |
发明(设计)人: | 林路路 | 申请(专利权)人: | 建湖云飞数据科技有限公司 |
主分类号: | G06F21/56 | 分类号: | G06F21/56 |
代理公司: | 南京常青藤知识产权代理有限公司 32286 | 代理人: | 史慧敏 |
地址: | 224000 江苏省盐城市建湖县高新*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 病毒文件 目标文件 变种 信息处理技术 单元文件 基准病毒 基准文件 鲁棒性 信息熵 哈希 检测 申请 | ||
本发明实施例公开了一种病毒文件识别方法,属于信息处理技术领域,本申请提供的病毒文件识别方法,在判断目标文件是否为基准文件的变种的过程中,以第一分片单元文件的信息熵作为目标文件的哈希,有较强的鲁棒性,能够准确的识别出基准病毒文件的变种,有效提升病毒文件检测的能力。
技术领域
本申请涉及信息处理技术领域,尤其涉及一种病毒文件识别方法。
背景技术
病毒文件检测通常采用消息摘要算法MD5等方法进行,但随着病毒软件的爆发式增长,很多病毒文件通过修改字节、插入、删除字节等方式,形成多种形式的变种病毒文件,现有的检测无法对该类变种病毒文件进行有效的检测。
发明内容
本发明实施例提供了一种能够有效的提升病毒文件检测准确性以及效率的病毒文件识别方法、设备以及计算机可读存储介质。
本发明实施例第一方面提供了一种病毒文件识别方法,包括:
通过专用链路获取目标文件;
将所述目标文件拆分成多个第一分片单元文件;
基于哈希算法分别计算多个所述第一分片单元文件的信息熵;
根据所述第一分片单元文件的信息熵和预先设置的权重参数确定第一系数,其中所述第一系数为所述第一分片单元文件的信息熵和所述权重参数的乘积;
根据所述第一系数获取第一熵向量,所述第一系数为所述第一熵向量的元素;
获取基准文件,所述基准文件包含有病毒标签;
将所述基准文件拆分成多个第二分片单元文件,所述第一分片单元文件和所述第二分片单元文件的数量相同;
根据所述第二分片单元文件的信息熵和预先设置的权重参数的乘积获取第二系数,根据所述第二系数获取所述第二熵向量,所述第二系数为所述第二熵向量的元素;
计算所述第一熵向量与第二熵向量的关联度系数值;
根据所述关联度系数值确定所述目标文件是否与所述基准文件相关联,当所述关联度系数值大于预设门限值时,确定所述目标文件和所述基准文件相关联,将所述目标文件打上与所述基准文件相同的病毒标签。
优选地,所述病毒文件识别方法中:
所述第一熵向量为x=(x1,x2,x3,...,xn)T;
其中,xn为所述第一熵向量所包括的第n个元素;
所述第二熵向量为y=(y1,y2,y3,...,yn)T;
其中,yn为所述第二熵向量所包括的第n个元素,维度T为所述第一熵向量或第二熵向量包括的元素的数量;
所述计算所述第一熵向量与第二熵向量的关联度系数值包括:
基于下述计算式计算所述第一熵向量与第二熵向量的关联度系数值s:
优选地,所述病毒文件识别方法中:
所述第一熵向量为x=(x1,x2,x3,...,xn)T,
其中,xn为所述第一熵向量所包括的第n个元素;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于建湖云飞数据科技有限公司,未经建湖云飞数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811306629.3/2.html,转载请声明来源钻瓜专利网。