[发明专利]一种语速对声纹安全影响的评估方法和系统在审
申请号: | 202111283004.1 | 申请日: | 2021-11-01 |
公开(公告)号: | CN114038472A | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 徐文渊;冀晓宇;迮俊宁;何睿文;程雨诗 | 申请(专利权)人: | 浙江大学 |
主分类号: | G10L17/22 | 分类号: | G10L17/22;G10L15/01 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语速 声纹 安全 影响 评估 方法 系统 | ||
1.一种语速对声纹安全影响的评估方法,其特征在于,包括如下步骤:
步骤1:获取不同说话人不同语速下的语音数据,构成说话人语料库;
步骤2:计算语料库中的每一条语音数据对应的语速,统计语速分布,将对应语音数据最多的语速记为原始语速;
步骤3:构造不同类型的注册语速-测试语速数据集合;
步骤4:利用步骤3得到的数据集合进行声纹识别测试:利用三种数据集合中的注册语速对应的语音数据对声纹模型进行注册,得到说话人声纹;然后利用不同的测试语速对应的语音数据对声纹模型进行测试得到测试结果,统计错误接受率和错误拒绝率,分别得到测试语速与错误接受率和错误拒绝率的关系曲线、注册语速-测试语速-错误接受率矩阵MFAR、注册语速-测试语速-错误拒绝率矩阵MFRR;
步骤5:根据注册语速-测试语速的错误接受率矩阵MFAR、注册语速-测试语速的错误拒绝率矩阵MFRR,计算加权关系矩阵M=λMFAR+μMFRR,其中,λ、μ分别为MFAR和MFRR的加权系数;
步骤6:对加权关系矩阵M的对角线数据进行拟合获得函数F1,将函数F1最小值对应的注册语速作为基准注册语速;对加权关系矩阵M中的不同注册语速分别进行拟合获得函数F2;
步骤7:根据用户注册语速、用户测试语速、函数F1和函数F2计算总误识别率差异,对总误识别率差异进行归一化处理,得到[0,1]区间内的语速安全性评分。
2.根据权利要求1所述的语速对声纹安全影响的评估方法,其特征在于,所述的步骤3中构造三种类型的注册语速-测试语速数据集合:
第一数据集合,从语料库中筛选出语速等于步骤2所述原始语速的语音数据和对应的说话人,将原始语速作为注册语速,将原始语速的语音数据分成两部分,分别作为注册集和测试集,对测试集利用语音时域伸缩法得到w档不同的语速作为测试语速;
第二数据集合,从语料库中筛选出语速等于步骤2所述原始语速的语音数据和对应的说话人,将原始语速作为注册语速,继续从语料库中筛选出每一位说话人对应的w档语速作为测试语速;
第三数据集合,从语料库中筛选出语速等于步骤2所述原始语速的语音数据和对应的说话人,将原始语速的语音数据分成两部分,分别作为注册集和测试集,分别对注册集和测试集利用语音时域伸缩法得到w档不同的注册语速和w档不同的测试语速。
3.根据权利要求1所述的语速对声纹安全影响的评估方法,其特征在于,计算语料库中的每一条语音数据对应的语速,具体为:
步骤2.1:将每条语音对应文本中的英语字母转换到音素,统计音素数量q;
步骤2.2:利用语音端点检测技术测量净语音时长t;
步骤2.3:用音素数量和净语音时长的比例代表语速,单位为音素/s。
4.根据权利要求2所述的语速对声纹安全影响的评估方法,其特征在于,所述第一数据集合中的测试语速对应的语音数据获取方式为:采用语音时域伸缩算法对原始语速下的语音数据进行时域拉伸度为α的时域伸缩,语音时长拉长为原来的α倍,相应的净语音时长变为αt,由于文本音素数量未发生改变,语速由s变为0<α<1时,语速变快;α>1时,语速变慢;α=1时,语速不变。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111283004.1/1.html,转载请声明来源钻瓜专利网。