[发明专利]基于变分自动编码器的口令生成方法、系统、介质和设备有效

专利信息
申请号: 202010716110.3 申请日: 2020-07-23
公开(公告)号: CN111966998B 公开(公告)日: 2023-07-18
发明(设计)人: 吴昊天;郑凯翰 申请(专利权)人: 华南理工大学
主分类号: G06F21/46 分类号: G06F21/46;G06F21/57
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 李斌
地址: 510640 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 自动 编码器 口令 生成 方法 系统 介质 设备
【权利要求书】:

1.一种基于变分自动编码器的口令生成方法,其特征在于,包括下述步骤:

口令集预处理;

构建初始的变分自动编码器结构,所述变分自动编码器结构包括编码器和解码器,所述编码器的结构采用循环神经网络后接两个线性层,所述解码器的结构采用循环神经网络构建;

训练模型:所述编码器学习口令集的分布,编码后得到低维的隐藏向量,所述隐藏向量分别通过两个线性层计算得到参数均值和标准差,通过重参数计算得到潜在向量,所述解码器通过潜在向量重建数据,得到重建数据计算重建数据与输入的原始口令集的误差,然后通过训练减少误差;

模型优化:模型的优化器计算损失函数,将结果反馈给变分自动编码器模型的编码器和解码器,通过梯度下降算法调整循环神经网络和线性层的参数;

所述模型的优化器计算损失函数,所述损失函数包括交叉熵损失函数与KL散度,分别用于衡量原始口令数据和重建后的口令数据的相似度,以及隐藏空间的分布与正态分布的相似度;

所述标准差的分布与正态分布之间的KL散度,具体计算公式为:

其中,N(μ,σ)表示标准差的分布,N(0,1)表示正态分布,μ表示参数均值,σ表示标准差;

模型训练优化后得到最优的分布参数均值和标准差,得到对应口令集的近似分布;

将参数均值和标准差通过正态分布计算得到潜在空间的分布情况,将潜在向量和首字母向量输入解码器,输出口令数据。

2.根据权利要求1所述的基于变分自动编码器的口令生成方法,其特征在于,所述口令集预处理的具体包括:数据清理、构建字典和文本矢量化表示;

所述数据清理具体步骤包括:清除口令集中长度超过预设值的口令,对无法编码的内容进行清洗;

所述构建字典具体步骤包括:对数据清理后的数据进行提取所用的字符,组成一个字典;

所述文本矢量化表示步骤包括:基于字典将使用的密码转换成one-hot向量表示。

3.根据权利要求1所述的基于变分自动编码器的口令生成方法,其特征在于,还包括序列数据处理步骤,所述循环神经网络接收序列输入,通过输入初始隐藏向量h,在每一个时刻t,更新隐藏向量h和生成数据o;

所述隐藏向量h更新公式为:

ht=f(Uxt+Wht-1)

其中,f表示一个非线性的激活函数,U表示输入到隐含层的权重矩阵,W表示状态到隐含层的权重矩阵;

所述生成数据o的计算公式为:

Ot=g(Vht)

其中,g表示非线性的激活函数。

4.根据权利要求1所述的基于变分自动编码器的口令生成方法,其特征在于,所述通过重参数计算得到潜在向量,具体计算步骤为:

从标准正态分布N(0,1)中采样一个向量ε,使得z=mu+exp(log(var))*ε;

其中,z表示潜在向量。

5.根据权利要求1所述的基于变分自动编码器的口令生成方法,其特征在于,所述梯度下降算法采用Adam算法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010716110.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top