[发明专利]一种基于WGAN模型的模糊检测种子集合生成方法及生成器在审
申请号: | 201810180933.1 | 申请日: | 2018-03-05 |
公开(公告)号: | CN108549597A | 公开(公告)日: | 2018-09-18 |
发明(设计)人: | 纪守领;吕晨阳;陈建海;李宇薇 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F11/36 | 分类号: | G06F11/36;G06N99/00 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 胡红娟 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模糊检测 种子集合 矩阵形式 训练集合 生成器 二进制形式 二进制 二进制模块 矩阵 程序异常 获取模块 矩阵模块 漏洞挖掘 模型生成 模型训练 输入格式 突变算法 真实数据 种子检测 新路径 转换 触发 收敛 发现 | ||
1.一种基于WGAN模型的模糊检测种子集合生成器,其特征在于,包括:
训练集合获取模块,具有基于突变算法的模糊检测工具,所述的模糊检测工具对普通输入进行随机修改得到随机输入,再通过所述随机输入检测多个输入格式相同的程序,将发现程序新路径或触发程序异常情况的随机输入作为WGAN模型的训练集合;
二进制转矩阵模块,将训练集合由二进制形式转换成WGAN模块可以学习的矩阵形式;
WGAN模块,包含WGAN模型,以转换成矩阵形式的训练集合为真实数据集,将WGAN模型训练至收敛,通过训练后的WGAN模型生成矩阵形式的模糊检测种子集合;
矩阵转二进制模块,将WGAN模块生成的模糊检测种子集合由矩阵形式转换为二进制形式。
2.根据权利要求1所示的模糊检测种子集合生成器,其特征在于,所述的模糊检测工具为AFL模糊测试工具。
3.根据权利要求1所示的模糊检测种子集合生成器,其特征在于,所述的WGAN模型包括:
生成器,学习真实数据的特征,并生成近似的虚假数据,将真实数据和虚假数据传输给判别器;
判别器,区分真实数据和虚假数据。
4.一种基于WGAN模型的模糊检测种子集合生成方法,其特征在于,包括以下步骤:
(1)通过基于突变算法的模糊检测工具对普通输入进行随机修改得到随机输入,再通过所述随机输入检测多个输入格式相同的程序,将发现程序新路径或触发程序异常情况的随机输入作为WGAN模型的训练集合;
(2)将所述的训练集合由二进制形式转换成WGAN模型可以学习的矩阵形式;
(3)以转换成矩阵形式的训练集合为真实数据集,将WGAN模型训练至收敛,通过训练后的WGAN模型生成矩阵形式的模糊检测种子集合;
(4)将所述的模糊检测种子集合由矩阵形式转换成二进制形式。
5.根据权利要求4所述的模糊检测种子集合生成方法,其特征在于,步骤(1)中,所述的模糊检测工具为AFL模糊检测工具。
6.根据权利要求4所述的模糊检测种子集合生成方法,其特征在于,步骤(2)包括:
(2-1)将所述的训练集合以二进制形式打开,按base64编码规则转换二进制文件;
(2-2)以每六个字符为一个字符串,以65进制将字符串转换成数字,最终将编码文件转换成矩阵中的数字,字符串不足时补零;
(2-3)对矩阵的元素进行归一化操作,使元素值处于[0,1)区间。
7.根据权利要求4所述的模糊检测种子集合生成方法,其特征在于,步骤(3)包括:
(3-1)以转换成矩阵形式的训练集合为真实数据集,交替训练WGAN模型的生成器和判别器,直至WGAN模型收敛;
(3-2)由训练后WGAN模型的生成器生成矩阵形式的模糊检测种子集合。
8.根据权利要求4所述的模糊检测种子集合生成方法,其特征在于,步骤(4)包括:
(4-1)对WGAN模型生成的矩阵的元素进行反归一化操作;
(4-2)根据base64编码,将矩阵的数字元素转换为字符串,以二进制形式进行保存。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810180933.1/1.html,转载请声明来源钻瓜专利网。