[发明专利]一种语速对声纹安全影响的评估方法和系统在审
申请号: | 202111283004.1 | 申请日: | 2021-11-01 |
公开(公告)号: | CN114038472A | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 徐文渊;冀晓宇;迮俊宁;何睿文;程雨诗 | 申请(专利权)人: | 浙江大学 |
主分类号: | G10L17/22 | 分类号: | G10L17/22;G10L15/01 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语速 声纹 安全 影响 评估 方法 系统 | ||
本发明公开了一种语速对声纹安全影响的评估方法和系统,该方法包括通过音素定位与切分测量公开语料库中的语音文件语速;通过语音时域伸缩技术扩充语料库获得多位说话人不同语速的语音数据;通过构造不同注册语速和测试语速的数据集,在声纹识别过程中探究不同语速下的语音对声纹误识别率的影响;在此基础上,设计了声纹语速安全性评分算法,量化衡量声纹的语速安全性,有助于厂家和用户提高声纹识别系统的安全性和可用性,具有显著的研究意义和社会价值。
技术领域
本发明属于声纹安全领域,涉及一种语速对声纹安全影响的评估方法和系统。
背景技术
声纹是用于将一个人的声音区分于其他人声音的生物特征,包括生理特征(例如声道形状)和行为特征(例如发音)。与其他生物特征识别技术相比,声纹具有易于使用、对硬件的需求低和可操作距离长等优点,可以广泛用于设备唤醒。通常,声纹识别词就是设备唤醒词。如今,大多数智能手机、智能语音系统和计算机的语音助手都具备声纹识别系统,声纹认证也成为了智能设备,公共安全和金融交易中最常用的生物特征认证方法之一。当前,对声纹安全缺乏测量和研究。
在实际应用中,商用声纹识别系统的精度较为普通,尤其是在存在环境干扰的情况下,验证精度会大大降低。随着人们对基于语音的访问控制的需求日益增长,保障声纹识别的安全性对当前的声纹识别系统是一个严峻的挑战,提升声纹识别系统的性能和安全性变得尤为迫切。
发明内容
为了解决上述技术问题,本发明提出了一种语速对声纹安全影响的评估方法和系统,该方法通过音素定位,将音素数量和净语音时长的比例定义为语速,测量公开语料库中的语音文件语速及其分布;通过语音时域伸缩技术扩充语料库,获得多位说话人不同语速的语音数据;通过构造不同注册语速和测试语速的数据集,在声纹识别过程中测试不同语速下的语音对声纹误识别率的影响;在此基础上,设计了声纹语速安全性评估算法,量化衡量声纹的语速安全性,有助于厂家和用户提高声纹识别系统的安全性和可用性,具有显著的研究意义和社会价值。
本发明所采用的技术方案是:
第一个目的在于提供一种语速对声纹安全影响的评估方法,包括如下步骤:
步骤1:获取不同说话人不同语速下的语音数据,构成说话人语料库;
步骤2:计算语料库中的每一条语音数据对应的语速,统计语速分布,将对应语音数据最多的语速记为原始语速;
步骤3:构造不同类型的注册语速-测试语速数据集合;
步骤4:利用步骤3得到的数据集合进行声纹识别测试:利用三种数据集合中的注册语速对应的语音数据对声纹模型进行注册,得到说话人声纹;然后利用不同的测试语速对应的语音数据对声纹模型进行测试得到测试结果,统计错误接受率和错误拒绝率,分别得到测试语速与错误接受率和错误拒绝率的关系曲线、注册语速-测试语速-错误接受率矩阵MFAR、注册语速-测试语速-错误拒绝率矩阵MFRR;
步骤5:根据注册语速-测试语速的错误接受率矩阵MFAR、注册语速-测试语速的错误拒绝率矩阵MFRR,计算加权关系矩阵M=λMFAR+μMFRR,其中,λ、μ分别为MFAR和MFRR的加权系数;
步骤6:对加权关系矩阵M的对角线数据进行拟合获得函数F1,将函数F1最小值对应的注册语速作为基准注册语速;对加权关系矩阵M中的不同注册语速分别进行拟合获得函数F2;
步骤7:根据用户注册语速、用户测试语速、函数F1和函数F2计算总误识别率差异,对总误识别率差异进行归一化处理,得到[0,1]区间内的语速安全性评分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111283004.1/2.html,转载请声明来源钻瓜专利网。