[发明专利]一种声纹识别方法有效

专利信息
申请号: 201210295572.8 申请日: 2012-08-17
公开(公告)号: CN102820033A 公开(公告)日: 2012-12-12
发明(设计)人: 申富饶;唐泽林;赵金熙;程佳 申请(专利权)人: 南京大学
主分类号: G10L17/00 分类号: G10L17/00
代理公司: 江苏圣典律师事务所 32237 代理人: 胡建华
地址: 210000 江苏*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 声纹 识别 方法
【说明书】:

技术领域

发明涉及一种生物特征识别领域中关于语音特征提取与识别技术领域,具体涉及一种声纹识别方法。

背景技术

生物特征识别技术是指利用人类本身所拥有的、能够标识其身份的生理特征或者行为特征进行身份验证的技术。与传统的身份验证技术相比,生物特征识别技术能够提供更方便的用户服务、提供更高的安全等级、可靠性,越来越多的用于现代安全系统的身份认证。

所谓声纹(Voiceprint),是用电声学仪器显示的携带言语信息的声波频谱。现代科学研究表明,声纹不仅具有特定性,而且有相对稳定性的特点。成年以后,人的声音可保持长期相对稳定不变。实验证明,无论讲话者是故意模仿他人声音和语气,还是耳语轻声讲话,即使模仿得惟妙惟肖,其声纹却始终相同。基于声纹的这两个特征,侦查人员就可将获取的犯罪分子的声纹和嫌疑人的声纹,通过声纹鉴定技术进行检验对比,迅速认定罪犯,为侦查破案提供可靠的证据。

声纹识别,是从一段语音中分析和提取出说话人的个性特征,自动确定说话人的身份的过程。声纹识别技术作为一种典型的生物特征识别技术,以其便捷、安全可靠等特点,在保安领域、公安司法领域、军事领域、财经领域、信息服务领域以及医学领域有广泛的应用前景。

自动声纹识别的基本过程是对人类语音片段进行特征提取,用提取好的特征向量训练分类器进行识别。一种常用的倒谱特征提取方法是对经过加窗、预加重的语音帧进行傅里叶变换,再对其滤波,然后进行离散余弦变换,若对语音帧用梅尔(Mel)滤波器进行滤波,则提取出的语音特征称为梅尔倒谱特征(MFCC,Mel-Frequency Cepstrum Coefficients)。而常用的声纹识别分类器模型有神经网络模型、隐马尔科夫模型、高斯混合模型(GMM,Gaussian Mixture Model)等。

经对现有技术文献的检索发现,RedaJourani等在《Speaker verification using large margin GMM discriminative training》中提出使用高维特征训练高斯混合模型,显然其付出的代价是昂贵的,且只比低维度的高斯混合模型提高了0.4%的等误识率。在高斯混合模型中,其时间复杂度与特征维度平方成正比,特征维度每增加一倍,训练模型所需的时间就变为四倍。普通的高斯混合模型无法满足增量学习的要求,在需要间断性学习的要求下,不得不每次重新学习所有的数据。

发明内容

发明目的:本发明所要解决的技术问题是针对现有技术的不足,提供一种声纹识别方法。

为了解决上述技术问题,本发明公开了一种声纹识别方法,包括以下步骤:

步骤1,对训练语音集内每个说话人的分段语音数据预处理,形成预处理后对应每个说话人的一组样本集合,一个说话人的语音数据唯一对应一个样本集合;

步骤2,对所有样本集合中每一个样本进行提取梅尔倒谱系数;

步骤3,逐一选定一个样本集合并随机选取其中部分样本的梅尔倒谱系数,对该样本集合训练高斯混合模型,直到所有样本集合都训练得到高斯混合模型,将所有高斯混合模型组成一个模型库;

步骤4,将步骤3中未被选取训练过的样本,与其对应样本集合的高斯混合模型逐个进行增量学习得到所有优化后的高斯混合模型,利用所有优化后的高斯混合模型优化模型库;

步骤5,输入并识别测试语音数据,利用步骤4中优化的模型库识别测试语音数据对应的样本集合的高斯混合模型,即确定对应说话人,将测试语音数据加入到该说话人对应的样本集合中。

本发明所述语音数据预处理包括:语音数据的加汉明窗分帧、计算每帧语音的短时能量和短时过零率,计算所有语音帧短时能量的算术平均值和所有帧短时过零率的算术平均值,将短时能量小于短时能量的算术平均值一半或短时过零率高于短时过零率的算术平均值的语音帧丢弃,剩下的语音数据作为预处理后的样本集合。

本发明步骤2中梅尔倒谱系数提取包括以下步骤:1)对每帧语音进行傅里叶变换;2)对变换后的语音帧进行梅尔倒谱滤波;3)对滤波后的语音帧进行离散余弦变换;4)求取一阶差分梅尔倒谱系数,将梅尔倒谱系数和一阶差分梅尔倒谱系数合并作为模型训练的特征参数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210295572.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top