[发明专利]基于自联想神经网络和高斯混合背景模型相结合的说话人确认方法无效

申请号：	200910024432.5	申请日：	2009-02-24
公开（公告）号：	CN101814159A	公开（公告）日：	2010-08-25
发明（设计）人：	余华;戴红霞;陈存宝;赵力;魏昕;奚吉;王青云;梁瑞宇	申请（专利权）人：	余华
主分类号：	G06N3/08	分类号：	G06N3/08;G10L17/00
代理公司：	暂无信息	代理人：	暂无信息
地址：	210096 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于联想神经网络混合背景模型相结合说话确认方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及一种说话人确认方法，特别涉及一种基于自联想神经网络和高斯混合背景模型相结合的说话人确认方法。

背景技术

在门禁、信用卡交易和法庭证据等方面，自动说话人确认，特别是与文本无关的说话人确认起着越来越重要的作用，它的目标是确认待测说话人是否是所称的那个人。

在说话人确认方法上，基于高斯混合背景模型(GMM-UBM)方法越来越受到重视，由于它具有识别率高，训练简单，训练数据量要求不大等优点，已经成为目前主流的识别方法。基于高斯混合模型超向量的支持向量机(SVM)和因子分析方法则代表GMM-UBM方法的最新成果，它们利用GMM-UBM模型训练获取均值超向量，利用投影或因子分析方法对均值超向量进行处理，再利用SVM或其它方法进行确认。由于高斯混合模型(GMM)具有很好的表示数据的分布的能力，只要有足够多的项，足够多的训练数据，GMM就能够逼近任何分布模型。但是，GMM只能逼近数据分布，对底层数据分布的改变无能为力，它不能对数据作任何变换，或者说不能改变数据的分布；另外，在选择GMM模型时，通常取各个高斯分布的方差矩阵为对角矩阵，这个假设也不是很合理，这样要求高斯混合项足够多；还有由于训练和确认时信道可能不匹配会导致确认率降低。

自联想神经网络(AANN)在说话人识别方面也占有重要的位置，多层感知器(MLP)、射线基(RadialBasis)网络、时延网络(TDNN)等已经成功应用于说话人识别，并且取得很好的识别效果。神经网络对特征向量进行变换，通过学习，使变换得到的特征向量以某种方式逼近目标向量，逼近的准则通常是最小均方误差(MMSE)准则。可以预见的是，如果将神经网络技术和高斯混合背景模型相结合起来，将会大大提高系统的识别率，但是目前还没有出现此类方法。

发明内容

本发明的目的就在于解决现有技术的缺陷，提出了基于自联想神经网络和高斯混合背景模型相结合的说话人确认方法。本发明的技术方案是：

基于自联想神经网络和高斯混合背景模型相结合的说话人确认方法，其特征在于包括以下步骤：

在训练时，利用自联想神经网络(AANN)对特征向量进行变换，并且学习特征向量集的结构，然后把学习结果以残差特征向量(即输入向量与AANN网络的输出之差)的形式提供给高斯混合模型(GMM)，进行GMM模型训练；

通过一个两阶段方法来训练这个通用背景模型和说话人模型，训练AANN网络的过程和训练GMM模型的过程交替进行；训练通用背景模型的GMM时采用期望最大(EM)方法，训练目标说话人模型的GMM时用最大后验概率(MAP)方法，训练AANN时采用带惯性的反向传播(BP)向后反演法；

在进行说话人确认时，由于AANN网络已经学习了目标说话人特征空间的结构，所以输入特征向量，AANN网络会把特征向量作适当的变换，然后提供给GMM模型，而会起到增强目标特征的似然概率，降低非目标特征的似然概率。在所述的基于自联想神经网络和高斯混合背景模型相结合的说话人确认方法中，所述的通用背景模型训练过程如下：

(1)确定GMM模型和AANN网络结构；

(2)设定收敛条件和最大迭代次数；

(3)随机确定AANN网络和GMM模型参数；

(4)把背景特征向量输入AANN网络，得到所有的残差向量；

(5)固定AANN网络参数，利用如下各式修正GMM模型各个高斯分布的权系数，均值和方差(可由均方值和均值得到)：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于余华，未经余华许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200910024432.5/2.html，转载请声明来源钻瓜专利网。