[发明专利]基于多序列长短期记忆网络的口令字典生成方法及系统有效
申请号: | 202110652105.5 | 申请日: | 2021-06-11 |
公开(公告)号: | CN113111329B | 公开(公告)日: | 2021-08-13 |
发明(设计)人: | 陈文;常庚;廖小瑶 | 申请(专利权)人: | 四川大学 |
主分类号: | G06F21/31 | 分类号: | G06F21/31;G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 四川省成都市天策商标专利事务所 51213 | 代理人: | 张秀敏 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 序列 短期 记忆 网络 口令 字典 生成 方法 系统 | ||
本发明公开了基于多序列长短期记忆网络的口令字典生成方法及系统,从训练集截取字符并进行字符编码,训练不同序列长度的LSTM模型;从训练集中首字符提取字符编码,输入相应的LSTM模型得到下一个字符;再选取相应的LSTM模型生成下一个字符;字符序列的长度大于模型最长序列长度时通过滑动窗口方式预测后面字符,取样到结束符时生成口令字符串,加入生成口令字典。本发明由多个LSTM模型级联组成,根据输入的样本序列选择相应的LSTM模型,保证生成结果的多样性;短序列LSTM输出作为下个序列长度LSTM的输入,最大程度使用学习到的信息,保证生成样本的准确性。
技术领域
本发明涉及信息安全技术领域,尤其是口令生成技术领域,具体的说,是一种基于多序列长短期记忆网络的口令字典生成方法及系统。
背景技术
近年来,人们相继提出了图形认证、指纹认证和人脸识别等许多新的身份认证方法,但是上述方法存在着特殊硬件要求、认证环境受限等,无法从根本上代替口令认证。目前,口令仍然是是身份认证最广泛使用的手段,用户需要强制设置口令作为身份认证的首要步骤。然而随着不断出现的口令泄露事件,口令认证的安全性受到了严重的威胁,探究口令生成方法及口令安全具有重要意义。口令猜测攻击是用户口令安全主要的研究方向之一。口令猜测攻击包括漫步猜测攻击和定向猜测攻击。在漫步猜测攻击中,攻击者没有特定的目标,其主要目的是破解尽可能多的口令。在定向猜测攻击中,攻击者通过收集目标特定的个人信息以提高猜测效率,在有限数量的口令猜测中破解目标口令。口令猜测的代表性工具包括HashCat和JtR(John the Ripper)等,需要根据规则生成口令,命中率较低。而传统的漫步猜测方法主要包括马尔可夫模型(Markov models)和概率上下文无关文法PCFG(Probabilistic Context-Free Grammars),这两种模型基于统计概率。2016年,Melicher等提出使用神经网络中的长短期记忆网络(LSTM)来实现口令猜测(William Melicher,Blase Ur ,Sean M Segreti et al.“Fast,lean,and accurate:Modeling passwordguessability using neural networks”.In:25th{USENIX}Security Symposium({USENIX}Security 16),2016:175–191.)。它需要预先设置一个固定的序列长度,在生成口令时根据输入序列预测口令的下一个字符。
由于传统LSTM神经网络在口令猜测中需要提前设置一个固定的序列长度,再在训练阶段根据设定的长度截取训练集,这样导致:
当模型设置的序列长度较大时,在口令生成阶段,使用较长的序列来预测下一个字符出现的概率。但如果训练样本数据小于此长度,则训练样本将无法将加入训练集,导致在训练过程中的口令样本不足,由于训练集的数据稀疏问题,训练后的模型生成很多重复的口令。
当模型设置的序列长度比较小时,口令和个人信息都可以加入训练集,使用较短的序列来预测下一个字符出现的概率,由于使用的输入序列信息太少,具有较大的随机性和发散性,导致对当前位置的字符概率计算不够准确,生成更多无规则的字符串,口令猜测结果的准确率低。
发明内容
本发明的目的在于提供一种基于多序列长短期记忆网络的口令字典生成方法及系统,用于解决现有技术中LSTM神经网络需要设置固定的序列长度,序列长度过长导致生成重复口令、序列长度过短导致口令猜解准确率低的问题。
本发明通过下述技术方案解决上述问题:
一种基于多序列长短期记忆网络的口令字典生成方法,包括:
步骤S100:将原始口令集和个人信息集加入训练集,将训练集中的每个字符作为一个类别,提取字符的字符编码作为特征向量,分别训练不同序列长度的LSTM模型,得到多分类问题的概率模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110652105.5/2.html,转载请声明来源钻瓜专利网。