[发明专利]口令猜测方法有效

申请号：	201910020006.8	申请日：	2019-01-09
公开（公告）号：	CN109829289B	公开（公告）日：	2023-02-17
发明（设计）人：	王蕊;徐岳皓;于展;廖勇;石珺;吕博;杨阳朝;叶雪洁;周阳	申请（专利权）人：	中国电子科技集团公司电子科学研究院
主分类号：	G06F21/46	分类号：	G06F21/46
代理公司：	工业和信息化部电子专利中心 11010	代理人：	于金平
地址：	100041 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	口令猜测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种口令猜测方法及设备。所述方法包括：对数据集进行预处理，提取数据集中的密码口令获得密码集，并按照预定比例对密码集进行划分，获得训练集和测试集；利用训练集构造隐马尔可夫模型，获得转移概率、观测概率和初始状态概率；对训练集中的各长度的密码口令的使用频次进行计算，获得用户口令长度概率分布，利用所述转移概率、观测概率、初始状态概率及所述口令长度概率分布生成猜测口令。本发明利用隐马尔可夫模型进行口令猜测，基于口令字符之间的初始状态概率，转换概率，观测概率对数据集的口令字符组合、顺序等模式进行挖掘发现，以此来更好地猜测口令，使得口令的猜测不需要用户的个人信息，猜测方法较为简单，没有局限性。

技术领域

本发明涉及密码口令分析技术领域，尤其涉及一种口令猜测方法及设备。

背景技术

随着信息时代的到来，信息安全问题受到越来越多的重视，用户认证机制成为保护用户隐私安全的一种常用方法。其中，文本口令具有实现简单方便等的特点，是最为普遍使用的一种用户认证方式，然而却存在口令强度不够高的问题。因此，口令的安全性研究成为热点问题，其中利用不同方法实现对口令集的猜测是一项重点研究方向，具有重要研究意义。一方面，从破解者的角度猜测用户口令可以使人们对口令的安全性有更深地认识；另一方面，猜测口令也可用于检测用户口令的强度，可方便用户在选择口令时避开容易被猜测到的口令，或在猜测口令结果的基础上更改口令以提升口令强度。

为了便于记忆，用户的口令一般不是随机的字符串，而是会包含一些特殊含义字符，例如，在选择口令时加入姓名缩写，生日等个人信息。尽管每个用户选择口令的偏好不同，但大量的用户口令数据集往往存在一定的统计特征和规律。因此，对大量用户口令数据集进行训练，可以挖掘出一些可预测的模式。

然而现有的密码口令猜测方法，在猜测口令时，需要预先知道用户信息，口令猜测方法针对的是某个特定的用户，而不是口令本身，因此猜测过程较为复杂，具有局限性。与此同时，在前期建立口令猜测模型时也需要利用用户的个人信息，但网上泄露的口令数据集往往并不包含用户的个人信息。因此，为了提高模型的训练效率与预测精度，需要工作人员进行大量的前期调研，寻找与用户口令匹配的用户信息，工作量较大。

发明内容

本发明实施例提供一种口令猜测方法设备，用以解决现有技术中存在的口令猜测复杂的问题。

第一方面，本发明实施例提供一种口令猜测方法，所述方法包括以下步骤：

对数据集进行预处理，提取数据集中的密码口令获得密码集，并按照预定比例对密码集进行划分，获得训练集和测试集；

利用训练集构造隐马尔可夫模型，获得转移概率、观测概率和初始状态概率；

对训练集中的各长度的密码口令的使用频次进行计算，获得口令长度的概率分布；

利用所述转移概率、观测概率、初始状态概率以及所述口令长度概率的分布生成猜测口令。

可选的，对密码集进行划分时的划分比例为3:1，以使获得的所述训练集与所述测试集的比例为3:1。

可选的，所述利用训练集构造隐马尔可夫模型，获得转移概率、观测概率和初始状态概率，具体包括：

设定隐马尔可夫模型为λ＝[A，B，π]＝[转移概率，观测概率，初始状态概率]；

设定状态集合为S＝{s₁，......，s₄}＝{字母，数字，汉字，特殊字符}；

设定训练集中各密码口令的字符状态序列为E_i，其中，E_i表示第i个密码口令，n_i表示第i个密码口令的字符个数，e₁表示密码口令中第一个字符的状态。