[发明专利]基于混合t模型的说话人识别方法无效

专利信息
申请号: 200810162449.2 申请日: 2008-11-25
公开(公告)号: CN101419799A 公开(公告)日: 2009-04-29
发明(设计)人: 吴朝晖;杨莹春;单振宇 申请(专利权)人: 浙江大学
主分类号: G10L17/00 分类号: G10L17/00
代理公司: 杭州天勤知识产权代理有限公司 代理人: 胡红娟
地址: 310027浙*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于混合t模型的说话人识别方法,包括如下步骤:1)特征提取:采集待识别的语音信号,对音频信号预处理,对预处理后的语音信号进行特征提取,得到语音信号的特征;2)说话人建模:采用混合t模型对语音特征建模,根据说话人的语音训练出其混合t模型的参数;3)测试:采用测试语音的后验概率表示得分,通过得分与阀值的比较,得到语音信号的识别结果,本发明采用混合t模型对说话人语音特征空间建模,提出了一种EM算法训练t混合模型的参数,提高说话人识别的鲁棒性。特别是当有较大的边缘噪音的时候,混合t分布比高斯混合分布更有鲁棒性。
搜索关键词: 基于 混合 模型 说话 识别 方法
【主权项】:
1、一种基于混合t模型的说话人识别方法,包括如下步骤:1)、特征提取:采集待识别的语音信号,对音频信号预处理,对预处理后的语音信号进行特征提取,得到语音信号的特征;2)、说话人建模:采用混合t模型对语音特征建模,根据说话人的语音训练出其混合t模型的参数;所述的混合t模型为:p(x)=Σi=1Mwiti(x)]]>其中,ti(x)表示t分布,x是一个p维的向量,wi表示每个t分布的混合权重,且满足Σi=1Mwi=1,]]>ti(x)定义为:ti(x)=Γ(γi+p2)|Σi|-1/2(Γ(12))pΓ(γi2)γip/2×(1+(x-μi)TΣi-1(x-μi)γi)(γi+p)/2]]>其中,μi,∑i,γi分别表示t分布的均值、t分布的方差矩阵和t分布的自由度,Γ表示gamma方程,其定义如下:Γ(x)=0e-ttx-1dt]]>3)、测试:计算步骤1)得到的待识别的语音信号的特征在某个说话人的混合t模型上的得分,通过得分与阀值的比较,得到语音信号的识别结果,得分表示为:score=Σi=1nlogp(xi|λt)]]>其中,xi表示待识别的语音信号的特征,n表示特征的数目,表示混合t模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200810162449.2/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top