[发明专利]基于自联想神经网络和高斯混合背景模型相结合的说话人确认方法无效
申请号: | 200910024432.5 | 申请日: | 2009-02-24 |
公开(公告)号: | CN101814159A | 公开(公告)日: | 2010-08-25 |
发明(设计)人: | 余华;戴红霞;陈存宝;赵力;魏昕;奚吉;王青云;梁瑞宇 | 申请(专利权)人: | 余华 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G10L17/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 210096 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 联想 神经网络 混合 背景 模型 相结合 说话 确认 方法 | ||
1.基于自联想神经网络和高斯混合背景模型相结合的说话人确认方法,其特征在于包括以下步骤:
在训练时,利用自联想神经网络(AANN)对特征向量进行变换,并且学习特征向量集的结构,然后 把学习结果以残差特征向量的形式提供给高斯混合模型(GMM),进行GMM模型训练;
通过一个两阶段方法来训练这个通用背景模型和说话人模型,训练AANN网络的过程和训练GMM模 型的过程交替进行;
其中,训练通用背景模型的GMM时采用期望最大(EM)方法,其训练过程为:
(1-1)确定GMM模型和AANN网络结构;
(1-2)设定收敛条件和最大迭代次数;
(1-3)随机确定AANN网络和GMM模型参数;
(1-4)把背景特征向量输入AANN网络,得到所有的残差向量;
(1-5)固定AANN网络参数,利用如下各式修正GMM模型各个高斯分布的权系数,均值和方差,其 中方差可由均方值和均值得到:
类别后验概率:
权系数:
均值:
均方值:
xt是一个N维的随机向量;bi(x),i=1,2,...,M是成员密度;pi,i=1,2,..,M是混合权值,满足 pi>0;每个成员密度是一个均值矢量为Ui、协方差矩阵为∑i的高斯函数,形式如下:
λ为完整的高斯混合密度由所有成员密度的均值矢量、协方差矩阵和混合权值参数λi的集合;
λi={pi,ui,∑i},i=1,2,...,M
(1-6)利用修正后的GMM模型各个高斯分布的权系数,均值向量和方差,把残差带入,得到一个似 然概率,利用带惯性的BP向后反演方法修正AANN网络参数;
(1-7)判断是否满足训练停止条件,是,停止训练,否,转(1-4);
训练目标说话人模型的GMM时用最大后验概率(MAP)方法,其训练过程为:
(2-1)给定收敛条件和最大迭代次数;
(2-2)通用背景模型的AANN网络和GMM模型参数作为模型初始参数
(2-3)把目标说话人特征向量输入AANN网络,得到所有的残差向量;
(2-4)固定AANN网络参数,修正GMM模型各个高斯分布的权系数,均值向量和方差,修正公式如
通常,取值相同,有
(2-5)利用修正后的GMM模型各个高斯分布的权系数,均值向量和方差,把残差带入,得到一个似 然概率,利用带惯性的BP向后反演方法修正AANN网络参数;
(2-6)判断是否满足训练停止条件,是,停止训练,否,转(2-3);
训练AANN时采用带惯性的反向传播(BP)向后反演法;
在进行说话人确认时,由于AANN网络已经学习了目标说话人特征空间的结构,所以输入特征向量, AANN网络会把特征向量作适当的变换,然后提供给GMM模型,而会起到增强目标特征的似然概率,降 低非目标特征的似然概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于余华,未经余华许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910024432.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:水稻干尖线虫的检测方法及诊断试剂盒
- 下一篇:显示屏接口信号自适应转接板