[发明专利]一种声纹识别方法、装置、设备和储存介质有效
申请号: | 201980003324.1 | 申请日: | 2019-12-24 |
公开(公告)号: | CN111149154B | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 陈昊亮;罗伟航 | 申请(专利权)人: | 广州国音智能科技有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王兆林 |
地址: | 510000 广东省广州市黄埔*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声纹 识别 方法 装置 设备 储存 介质 | ||
本申请公开了一种声纹识别方法、装置、设备和储存介质,其中方法包括:获取待识别语音;提取待识别语音的第一语谱图;将第一语谱图输入到预置受限玻尔兹曼机中进行特征提取;将提取的特征输入到预置SVM分类器中,得到待识别语音的识别结果。本申请通过预置受限玻尔兹曼机对提取的样本语音的第一语谱图进行特征提取,将提取的特征输入到预置SVM分类器中进行分类识别,解决了现有的声纹识别方法通过人工比对频谱图进行识别,存在的识别效率低和准确率低的技术问题。
技术领域
本申请涉及声纹识别技术领域,尤其涉及一种声纹识别方法、装置、设备和储存介质。
背景技术
声纹识别是指通过未知说话人或不确定说话人的语音声学特征与已知说话人的语音声学特征进行综合分析比对,做出两者是否同一的结论的过程。现有的声纹识别方法通常是将样本语音的频谱图与检材语音的频谱图进行人工比对,得到声纹识别结果,该方法存在效率低和识别准确率低的问题。
发明内容
本申请提供了一种声纹识别方法、装置、设备和储存介质,用于解决现有的声纹识别方法通过人工比对频谱图进行识别,存在的识别效率低和准确率低的技术问题。
有鉴于此,本申请第一方面提供了一种声纹识别方法,包括:
获取待识别语音;
提取所述待识别语音的第一语谱图;
将所述第一语谱图输入到预置受限玻尔兹曼机中进行特征提取;
将提取的特征输入到预置SVM分类器中,得到所述待识别语音的识别结果。
优选地,所述将所述第一语谱图输入到预置受限玻尔兹曼机中进行特征提取,之前还包括:
获取训练样本语音数据集;
提取所述训练样本语音数据集中的训练样本语音的第二语谱图;
将所述第二语谱图输入到受限玻尔兹曼机,对所述受限玻尔兹曼机进行优化训练,得到目标参数,所述目标参数包括权重参数、可视单元的偏置和隐藏单元的偏置;
基于多目标优化算法对所述隐藏单元的偏置进行优化,得到优化后的所述受限玻尔兹曼机;
将所述第二语谱图输入到优化后的所述受限玻尔兹曼机进行特征提取,使得优化后的所述受限玻尔兹曼机输出声纹特征;
将所述声纹特征输入到SVM分类器中,对所述SVM分类器进行训练;
计算所述SVM分类器对训练样本语音数据集的识别率;
当所述识别率小于阈值时,返回所述将所述第二语谱图输入到受限玻尔兹曼机,对所述受限玻尔兹曼机进行优化训练,得到目标参数的步骤;
当所述识别率大于或等于所述阈值时,得到训练好的所述受限玻尔兹曼机和训练好的所述SVM分类器,将训练好的所述受限玻尔兹曼机作为所述预置受限玻尔兹曼机,将训练好的所述SVM分类器作为所述预置SVM分类器。
优选地,所述基于多目标优化算法对所述隐藏单元的偏置进行优化,得到优化后的所述受限玻尔兹曼机,包括:
在所述隐藏单元的偏置中随机选取若干个偏置参数,生成第一偏置数据集;
基于多目标优化算法对所述第一偏置数据集进行优化,得到第二偏置数据集;
基于所述第二偏置数据集对所述第一偏置数据集中的偏置参数进行更新,得到优化后的所述受限玻尔兹曼机。
优选地,所述提取所述待识别语音的第一语谱图,之前还包括:
对所述待识别语音进行预处理。
本申请第二方面提供了一种声纹识别装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州国音智能科技有限公司,未经广州国音智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980003324.1/2.html,转载请声明来源钻瓜专利网。