[发明专利]基于深度学习的文本相关声纹生物密钥生成方法有效
申请号: | 202110348221.8 | 申请日: | 2021-03-31 |
公开(公告)号: | CN113179157B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 吴震东;周昊文 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | H04L9/08 | 分类号: | H04L9/08;G10L17/02;G10L17/04;G10L17/18;G10L25/24;G10L25/30 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱亚冠 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 学习 文本 相关 声纹 生物 密钥 生成 方法 | ||
本发明公开基于深度学习的文本相关声纹生物密钥生成方法。利用经典声纹信号处理方法与针对声纹特征图像的深度神经网络处理方法相结合,实现了文本相关的声纹信号的稳定特征提取、特征序列稳定等系列操作,更为精准地提取话者不同样本的稳定特征分量,并通过声纹密钥深度神经网络的层层处理,进一步稳定声纹特征于特征值,最后通过声纹密钥模糊提取器,实现正常文本相关语音高强度声纹密钥序列生成,所生成的声纹生物密钥长度可大于512bit。本发明不存在需记录的生物特征模板信息,降低了隐私泄露的风险,同时用户无需高强度的记忆即可生成高安全性的密钥。
技术领域
本发明属于信息安全技术领域,具体涉及一种从人类声纹中经由深度学习生成生物密钥的方法。生成的密钥即可用于身份认证,也可用于加密,可以理解为网络安全中泛在加密技术的一种。
背景技术
声纹识别技术是现今比较成熟的生物特征识别技术,在低噪音环境中声纹识别准确率可达到95%以上。基于声纹的身份认证技术,其基本方法为:1)采集用户语音信号,经语音信号处理提取用户声纹特征,生成声纹特征模板,存储在本地安全域或远端网络认证服务器中;2)当某用户需要进行身份认证时,再次采集用户语音信号,提取用户声纹特征;3)将用户声纹特征与存储的相应用户声纹特征模板进行比对,一致则认证通过,不一致则认证失败。由于本地安全域存在被读取的可能,认证服务器一般不是可信第三方,使得存储的声纹特征模板的安全性受到质疑,一般认为目前的生物特征认证系统设计存在较为严重的隐私安全问题。
现有的声纹特征隐私保护方案主要集中在声纹特征模板保护方面。模板保护一般采用对特征模板进行函数运算产生新的特征模板的方法来保护生物特征原始信息,要求由新的特征模板一般难以推知原始特征信息。模板变形、模糊金库等方法均可以归入此类方法。模板保护方法在使用过程中存在识别准确率下降,原始特征信息依然存在被恢复的可能等问题。声纹生物密钥技术直接从声纹特征中获取高强度的稳定的声纹密钥序列,可直接参与加密运算,亦可用于身份特征识别,可以扩展声纹技术在信息安全领域的应用范围。
现有的声纹生物密钥生成技术主要有:(1)中国专利号201410074511.8公开了“一种人类声纹生物密钥生成方法”,方法将声纹特征序列向高维空间中投影,在高维空间中将特征序列稳定到可接受的波动范围内,再对稳定后的特征序列编码,从编码中提取生物密钥。该方法可以对基于MFCC的声纹特征序列起到一定的稳定效果,但由于基于MFCC的声纹特征受环境、发声状态等因素影响较大,使得单纯依靠MFCC的声纹特征的高维空间投影方法,密钥生成的准确率和强度均不够高,一般能提取的稳定比特序列长度不足256bit。中国发明专利ZL201110003202.8基于声纹的文档加密及解密方法,提出了一个从声纹信息中提取稳定密钥序列的方案。但是该方案仅用棋盘法稳定声纹特征值,稳定效果有限。并且棋盘法事实是通过缩小编码空间来稳定特征值,如1024的值空间映射为16的值空间,这使得密钥序列的长度缩短,降低了安全性。
发明内容
本发明的目的是针对现有的文本相关声纹生物密钥生成方法的不足,提出了一种基于深度学习的文本相关声纹生物密钥生成方法。
基于深度学习的文本相关声纹生物密钥生成分两部分,第一部分为声纹生物密钥训练部分,第二部分为声纹生物密钥提取部分。
所述声纹生物密钥训练部分具体步骤为:
步骤(1)、获取文本相关内容的纯净训练语音数据;
步骤(2)、对步骤(1)纯净训练语音数据进行第1阶段预处理,具体是对步骤(1)纯净训练语音数据提取MFCC系数,并利用上述MFCC系数进行混合数为N的高斯混合模型训练;
所述的MFCC系数提取方法为现有常规技术。
所述高斯混合模型由N个高维高斯分布组成,N=8~32,可由用户根据经验选定;每一个高斯分布的均值向量组成N×nx维的矩阵,将N×nx维的矩阵归一化至取值为[0,255]的图像灰度矩阵,即声纹特征图像1,其中nx为MFCC系数个数,一般取20。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110348221.8/2.html,转载请声明来源钻瓜专利网。