[发明专利]一种基于深度学习的密码字典生成技术在审
申请号: | 202111652277.9 | 申请日: | 2021-12-30 |
公开(公告)号: | CN114330306A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 刘慧敏;肖晟 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06F40/237 | 分类号: | G06F40/237;G06N3/04 |
代理公司: | 武汉菲翔知识产权代理有限公司 42284 | 代理人: | 梁燕飞 |
地址: | 410082 湖南省*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 密码 字典 生成 技术 | ||
本发明公开了一种基于深度学习的密码字典生成技术,从数据集中筛选出符合实验要求的密码,用word2vec对于密码进行词嵌入处理获得组成密码的字符对应的字符向量,经过一定处理输入到lstm神经网络中,根据得到模型进行密码字典的生成,本发明涉及密码数据技术领域。该基于深度学习的密码字典生成技术,相较于PCFG(概率上下文无关文法)、马尔可夫模型、GAN等,LSTM在自然语言处理方面有更好的表现,故本发明将组成密码的字符当作自然语言当中的单词来进行处理,应用LSTM方法可以得到符合人类设置密码习惯的、命中率更高的密码字典,可以对弱密码字典、密码爆破效果有一定的提升,可以应用于各种安全场景。
技术领域
本发明涉及密码数据技术领域,具体为一种基于深度学习的密码字典生成技术。
背景技术
互联网发展的同时伴随着各种安全事件,有很多密码数据集被泄露,被泄露的用户密码也反映出用户设置密码的一些信息。有了这些数据集,密码攻击、密码生成、用户密码习惯等方面的研究层出不穷,其中密码生成已成为提高社会工程学中身份验证效率的新兴问题,并且在检查安全漏洞中起着重要作用。
与传统方法相比,越来越多的研究人员证明神经网络中的方法对于密码猜测更为准确和实用。同时,学习人类创造的密码,可以训练生成更符合人类生成密码习惯的模型,通过得到的模型去生成“拟人化”的密码字典,使生成的密码字典在密码猜测过程中表现更好。
发明内容
针对现有技术的不足,本发明提供了一种基于深度学习的密码字典生成技术,可以生成更符合人类生成密码的习惯的密码字典,使基于深度学习的密码猜测相较于遍历弱密码字典、暴力破解密码等传统方法能有更好的效果。
为实现以上目的,本发明通过以下技术方案予以实现:一种基于深度学习的密码字典生成技术,具体包括以下步骤:
S1、对于密码数据集进行清洗,筛选出符合实验要求的密码,筛选出包含的字符是字母、数字、符号的组合,并且长度是8-16位的密码。并且将数据集分成训练集、验证集和测试集;
S2、word2vec对于密码进行词嵌入处理获得组成密码的字符对应的字符向量,对下一步输入lstm神经网络做准备;
S3、用获取S2生成的字符向量,组成由字符向量组成的输入列表,不足16位的用空格字符向量补全,作为整个模型的输入;根据字符对应的ascii码作为标签,包含除去第一位的所有字符,由固定数值M补足16位;
S4、将S3中处理好的向量输入到lstm神经网络模型中,设置好输出列表的大小,选择交叉熵来计算模型的损失,通过数次训练得到损失小效果优的模型参数,用作密码字典的生成;
S5、使用S4得到的模型,进行密码字典生成。
优选的,所述S1中,筛选方法是筛选出包含的字符是字母、数字、符号的组合,并且长度是8-16位的密码,并且将数据集分成训练集、验证集和测试集。
优选的,所述S3中,最终,我们需要确定输出什么值,这个输出将会基于细胞状态,但是也是一个过滤后的版本,首先,运行一个sigmoid层来确定细胞状态的哪个部分将输出出去,接着,把细胞状态通过tanh进行处理(得到一个在-1到1之间的值)并将它和sigmoid门的输出相乘,最终仅仅会输出确定输出的那部分。
优选的,所述S5中,密码字典生成具体包括以下步骤:
S1、获取所有密码数据的首字母出现的概率,用以后面使用,初始化一个空集S;
S2、设置密码字典大小为N,以S内的密码数量Count(S)是否小于N为条件循环生成密码序列;
S3、初始化空集password,在概率最大的前λ个字符中随机选取一个并添加到password中;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111652277.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种掩模版及光刻机
- 下一篇:显示面板及其制造方法