[发明专利]恶意PDF检测方法、系统、数据存储设备和检测程序在审

申请号：	201810832905.3	申请日：	2018-07-26
公开（公告）号：	CN108959930A	公开（公告）日：	2018-12-07
发明（设计）人：	李国;黄永健;王静;徐俊洁;王鹏	申请（专利权）人：	中国民航大学
主分类号：	G06F21/56	分类号：	G06F21/56
代理公司：	天津市鼎和专利商标代理有限公司 12101	代理人：	蒙建军
地址：	300300 天***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	信息熵检测数据存储设备可疑文件信息安全技术决策树算法恶意攻击模型检测时间消耗正常文件字节序列分类分析统计
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种恶意PDF检测方法，其特征在于：至少包括如下步骤：

步骤一、将待检PDF文件转换成字节序列，计算每个PDF件的信息熵；

步骤二、根据统计的恶意PDF文件和良性PDF文件的信息熵值的最大值、最小值和平均值以及经验值设置阈值α，将每个PDF文件的信息熵与阈值α比较，把信息熵高于α的PDF文件作为正常文件，把信息熵低于α的PDF文件作为可疑文件；

步骤三、利用Origami分析提取可疑文件中常用于恶意攻击的JavaScript和结构特征；

步骤四、利用C5.0决策树算法进行分类。

2.根据权利要求1所述的恶意PDF检测方法，其特征在于：上述步骤一具体为：首先用PDFParser将待检PDF文件转换成二进制字节文件，然后计算每个PDF文件的信息熵。

3.根据权利要求1所述的恶意PDF检测方法，其特征在于：上述步骤三具体为：首先利用Origami分析可疑文件的结构并搜索恶意特征和结构的一般特征,然后再分析可疑文件的JavaScript代码并搜索恶意特征。

4.根据权利要求1所述的恶意PDF检测方法，其特征在于：上述步骤四具体为：首先把每个PDF文件用一个向量表示，该向量由结构的一般特征、结构的动态特征和JavaScript特征组成；然后将向量、类别输入到C5.0决策树进行分类。

5.一种恶意PDF检测系统，其特征在于：包括：

信息熵计算模块，将待检PDF文件转换成字节序列，计算每个PDF件的信息熵；

甄别模块、根据统计的恶意PDF文件和良性PDF文件的信息熵值的最大值、最小值和平均值以及经验值设置阈值α，将每个PDF文件的信息熵与阈值α比较，把信息熵高于α的PDF文件作为正常文件，把信息熵低于α的PDF文件作为可疑文件；

分析模块、利用Origami分析提取可疑文件中常用于恶意攻击的JavaScript和结构特征；

分类模块、利用C5.0决策树算法进行分类。

6.一种数据存储设备，其特征在于：包括指令，当其在计算机上运行时，使得计算机执行权利要求1-4任一项的恶意PDF检测方法。

7.一种实现权利要求1-4任一项的恶意PDF检测方法的检测程序。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国民航大学，未经中国民航大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810832905.3/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载