[发明专利]基于变分自动编码器的口令生成方法、系统、介质和设备有效
申请号: | 202010716110.3 | 申请日: | 2020-07-23 |
公开(公告)号: | CN111966998B | 公开(公告)日: | 2023-07-18 |
发明(设计)人: | 吴昊天;郑凯翰 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F21/46 | 分类号: | G06F21/46;G06F21/57 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 自动 编码器 口令 生成 方法 系统 介质 设备 | ||
1.一种基于变分自动编码器的口令生成方法,其特征在于,包括下述步骤:
口令集预处理;
构建初始的变分自动编码器结构,所述变分自动编码器结构包括编码器和解码器,所述编码器的结构采用循环神经网络后接两个线性层,所述解码器的结构采用循环神经网络构建;
训练模型:所述编码器学习口令集的分布,编码后得到低维的隐藏向量,所述隐藏向量分别通过两个线性层计算得到参数均值和标准差,通过重参数计算得到潜在向量,所述解码器通过潜在向量重建数据,得到重建数据计算重建数据与输入的原始口令集的误差,然后通过训练减少误差;
模型优化:模型的优化器计算损失函数,将结果反馈给变分自动编码器模型的编码器和解码器,通过梯度下降算法调整循环神经网络和线性层的参数;
所述模型的优化器计算损失函数,所述损失函数包括交叉熵损失函数与KL散度,分别用于衡量原始口令数据和重建后的口令数据的相似度,以及隐藏空间的分布与正态分布的相似度;
所述标准差的分布与正态分布之间的KL散度,具体计算公式为:
其中,N(μ,σ)表示标准差的分布,N(0,1)表示正态分布,μ表示参数均值,σ表示标准差;
模型训练优化后得到最优的分布参数均值和标准差,得到对应口令集的近似分布;
将参数均值和标准差通过正态分布计算得到潜在空间的分布情况,将潜在向量和首字母向量输入解码器,输出口令数据。
2.根据权利要求1所述的基于变分自动编码器的口令生成方法,其特征在于,所述口令集预处理的具体包括:数据清理、构建字典和文本矢量化表示;
所述数据清理具体步骤包括:清除口令集中长度超过预设值的口令,对无法编码的内容进行清洗;
所述构建字典具体步骤包括:对数据清理后的数据进行提取所用的字符,组成一个字典;
所述文本矢量化表示步骤包括:基于字典将使用的密码转换成one-hot向量表示。
3.根据权利要求1所述的基于变分自动编码器的口令生成方法,其特征在于,还包括序列数据处理步骤,所述循环神经网络接收序列输入,通过输入初始隐藏向量h,在每一个时刻t,更新隐藏向量h和生成数据o;
所述隐藏向量h更新公式为:
ht=f(Uxt+Wht-1)
其中,f表示一个非线性的激活函数,U表示输入到隐含层的权重矩阵,W表示状态到隐含层的权重矩阵;
所述生成数据o的计算公式为:
Ot=g(Vht)
其中,g表示非线性的激活函数。
4.根据权利要求1所述的基于变分自动编码器的口令生成方法,其特征在于,所述通过重参数计算得到潜在向量,具体计算步骤为:
从标准正态分布N(0,1)中采样一个向量ε,使得z=mu+exp(log(var))*ε;
其中,z表示潜在向量。
5.根据权利要求1所述的基于变分自动编码器的口令生成方法,其特征在于,所述梯度下降算法采用Adam算法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010716110.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于物联网的健康防疫管理系统
- 下一篇:一种电缆用负载燃烧检测装置