[发明专利]一种基于用户名信息的密码猜测集生成方法及密码破解方法在审
申请号: | 201611079933.X | 申请日: | 2016-11-30 |
公开(公告)号: | CN106803035A | 公开(公告)日: | 2017-06-06 |
发明(设计)人: | 陈小军;徐睿;时金桥;谭建龙;文新;胡兰兰;王颖冰;于晓杰 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06F21/45 | 分类号: | G06F21/45;G06F21/46;G06F21/31;G06F21/60;H04L29/06 |
代理公司: | 北京君尚知识产权代理事务所(普通合伙)11200 | 代理人: | 司立彬 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 用户名 信息 密码 猜测 生成 方法 破解 | ||
技术领域
本发明涉及一种基于用户名信息的密码猜测集生成方法及密码破解方法。
背景技术
长时间以来,破解密码使用传统的暴力破解方法,但这种方法没有对密码进行深入的分析,以至于效果和效率都不尽如人意。
在一些新方法中,自然语言处理的思想和工具被应用到密码分析和破解当中。这种方法将密码也视为某种形式的自然语句,由一系列片段按照一定的层次结构组合而成。出现在密码中的片段通常是字典中的单词、日期或者其他有意义的字符串,而这些片段的组合结构常常体现出某些固定模式。可以使用NLTK(Natural Language Toolkit)以及WordNet工具对密码进行分词、词性标注以及语义类别标注。然后,利用自然语言处理中概率上下文无关文法(Probability Context-Free Grammars,PCFGs)学习生成密码的语法规则,并按照概率降序生成密码猜测集。但是,当被攻击网站含有较多弱密码时,这种方法被证明破解效率较低。另外,当被用于破解中文网站密码时,该方法破解效率也较差,原因在于其分词系统并不能有效为中文拼音分词。
这种方法的主要问题在于未能充分分析密码中的语义内容以及各语义类别之间的语法,也未能给所使用的字典中的单词分配合适的概率。
发明内容
本发明的目的是将自然语言处理领域的思想和工具运用到密码分析和破解领域中来,对用户名分解分析,提取片段和结构特征,利用用户名和密码的片段相似性和结构相似性,理解密码的构成语义,加快密码破解速度,是一种基于用户名信息的密码猜测集生成方法及密码破解方法。
为了利用用户名中包含的信息来提高密码破解效率,本发明提供了一种基于PCFGs并能提取用户名密码间语义相似性的密码猜测生成器,简称基于语义相似性的密码猜测生成器。
本发明的技术方案为:
一种基于用户名信息的密码猜测集生成方法,其步骤为:
1)对泄漏数据训练集中的用户名、密码分别进行分词和语义结构标注,计算用户名、密
码的语义相似性;其中,所述语义相似性包括语义结构相似性和语义片段相似性;
2)将该语义相似性应用到PCFGs语法中,即基于语义相似性构建PCFGs语法;
3)根据步骤2)构建的PCFGs语法,按照概率降序生成密码猜测集。
一种基于用户名信息的密码破解方法,其步骤为:
1)对泄漏数据训练集中的用户名、密码分别进行分词和语义结构标注,计算用户名、密码的语义相似性;其中,所述语义相似性包括语义结构相似性和语义片段相似性;
2)将该语义相似性应用到PCFGs语法中,即基于语义相似性构建PCFGs语法;
3)根据步骤2)构建的PCFGs语法,按照概率降序生成密码猜测集;
4)根据该密码猜测集进行密码破解。
进一步的,基于语义相似性构建PCFGs语法的方法为:根据用户名、密码的语义结构相似性,得到不同语义结构的用户名所选用的分布不同的密码结构,将密码结构作为PCFGs语法的非终端结构;根据用户名、密码的语义片段相似性,选取用户名中的语义片段加入到用来生成密码的PCFGs语法的终端词集合中,得到PCFGs语法的终端词集合。
进一步的,对于密码中的片段,如果该片段出现在泄漏数据训练集的用户名中,则将该片段在泄漏数据训练集中的频数乘以一个概率系数α,并将扩大α倍的频数累加到所述终端词集合中该片段原有的频数上作为该片段的新频数;若所述终端词集合中不含该片段,则将该片段及其频数信息一起加入到所述终端词集合中;然后更新所述终端词集合中终端词的概率分布。
进一步的,所述步骤3)的实现方法为:为每一非终端结构建立一个优先级队列,该优先级队列用于存储对应的非终端结构按概率降序生成的密码猜测;然后对所有优先级队列的第一个元素进行遍历,找出概率最大的密码,将该密码出队列输出到密码猜测集,再进行下一次密码查找,直到密码猜测集中密码数量达到规定值。
进一步的,对用户名、密码按照语义类别分词和语义结构标注;其中,所述语义类别包括拼音姓名、拼音姓名缩写、拼音名、拼音姓、拼音短语、其他拼音、英文短语、英文姓名、英文单词、其他字母、数字日期、其他数字、单个字符重复、字符串重复、键盘等间距跳跃、键盘上同一行字符相邻、键盘上不同行字符相邻和其他特殊符号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611079933.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种终端和解锁窗口的自适应调动方法
- 下一篇:一种软件安全防护方法及装置
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置