[发明专利]基于混合t模型的说话人识别方法无效

申请号：	200810162449.2	申请日：	2008-11-25
公开（公告）号：	CN101419799A	公开（公告）日：	2009-04-29
发明（设计）人：	吴朝晖;杨莹春;单振宇	申请（专利权）人：	浙江大学
主分类号：	G10L17/00	分类号：	G10L17/00
代理公司：	杭州天勤知识产权代理有限公司	代理人：	胡红娟
地址：	310027浙***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于混合t模型的说话人识别方法，包括如下步骤：1)特征提取：采集待识别的语音信号，对音频信号预处理，对预处理后的语音信号进行特征提取，得到语音信号的特征；2)说话人建模：采用混合t模型对语音特征建模，根据说话人的语音训练出其混合t模型的参数；3)测试：采用测试语音的后验概率表示得分，通过得分与阀值的比较，得到语音信号的识别结果，本发明采用混合t模型对说话人语音特征空间建模，提出了一种EM算法训练t混合模型的参数，提高说话人识别的鲁棒性。特别是当有较大的边缘噪音的时候，混合t分布比高斯混合分布更有鲁棒性。
搜索关键词：	基于混合模型说话识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1、一种基于混合t模型的说话人识别方法，包括如下步骤：1)、特征提取：采集待识别的语音信号，对音频信号预处理，对预处理后的语音信号进行特征提取，得到语音信号的特征；2)、说话人建模：采用混合t模型对语音特征建模，根据说话人的语音训练出其混合t模型的参数；所述的混合t模型为：p(x)=Σi=1Mwiti(x)]]>其中，t_i(x)表示t分布，x是一个p维的向量，w_i表示每个t分布的混合权重，且满足Σi=1Mwi=1,]]>t_i(x)定义为：ti(x)=Γ(γi+p2)|Σi|-1/2(Γ(12))pΓ(γi2)γip/2×(1+(x-μi)TΣi-1(x-μi)γi)(γi+p)/2]]>其中，μ_i，∑_i，γ_i分别表示t分布的均值、t分布的方差矩阵和t分布的自由度，Γ表示gamma方程，其定义如下：Γ(x)=∫0∞e-ttx-1dt]]>3)、测试：计算步骤1)得到的待识别的语音信号的特征在某个说话人的混合t模型上的得分，通过得分与阀值的比较，得到语音信号的识别结果，得分表示为：score=Σi=1nlogp(xi|λt)]]>其中，x_i表示待识别的语音信号的特征，n表示特征的数目，表示混合t模型。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江大学，未经浙江大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/200810162449.2/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于混合t模型的说话人识别方法无效

专利文献下载