[发明专利]基于混合t模型的说话人识别方法无效
| 申请号: | 200810162449.2 | 申请日: | 2008-11-25 | 
| 公开(公告)号: | CN101419799A | 公开(公告)日: | 2009-04-29 | 
| 发明(设计)人: | 吴朝晖;杨莹春;单振宇 | 申请(专利权)人: | 浙江大学 | 
| 主分类号: | G10L17/00 | 分类号: | G10L17/00 | 
| 代理公司: | 杭州天勤知识产权代理有限公司 | 代理人: | 胡红娟 | 
| 地址: | 310027浙*** | 国省代码: | 浙江;33 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | 本发明公开了一种基于混合t模型的说话人识别方法,包括如下步骤:1)特征提取:采集待识别的语音信号,对音频信号预处理,对预处理后的语音信号进行特征提取,得到语音信号的特征;2)说话人建模:采用混合t模型对语音特征建模,根据说话人的语音训练出其混合t模型的参数;3)测试:采用测试语音的后验概率表示得分,通过得分与阀值的比较,得到语音信号的识别结果,本发明采用混合t模型对说话人语音特征空间建模,提出了一种EM算法训练t混合模型的参数,提高说话人识别的鲁棒性。特别是当有较大的边缘噪音的时候,混合t分布比高斯混合分布更有鲁棒性。 | ||
| 搜索关键词: | 基于 混合 模型 说话 识别 方法 | ||
【主权项】:
                1、一种基于混合t模型的说话人识别方法,包括如下步骤:1)、特征提取:采集待识别的语音信号,对音频信号预处理,对预处理后的语音信号进行特征提取,得到语音信号的特征;2)、说话人建模:采用混合t模型对语音特征建模,根据说话人的语音训练出其混合t模型的参数;所述的混合t模型为:p ( x ) = Σ i = 1 M w i t i ( x )  ]]> 其中,ti(x)表示t分布,x是一个p维的向量,wi表示每个t分布的混合权重,且满足Σ i = 1 M w i = 1 ,  ]]> ti(x)定义为:t i ( x ) = Γ ( γ i + p 2 ) | Σ i | - 1 / 2 ( Γ ( 1 2 ) ) p Γ ( γ i 2 ) γ i p / 2 × ( 1 + ( x - μ i ) T Σ i - 1 ( x - μ i ) γ i ) ( γ i + p ) / 2  ]]> 其中,μi,∑i,γi分别表示t分布的均值、t分布的方差矩阵和t分布的自由度,Γ表示gamma方程,其定义如下:Γ ( x ) = ∫ 0 ∞ e - t t x - 1 dt  ]]> 3)、测试:计算步骤1)得到的待识别的语音信号的特征在某个说话人的混合t模型上的得分,通过得分与阀值的比较,得到语音信号的识别结果,得分表示为:score = Σ i = 1 n log p ( x i | λ t )  ]]> 其中,xi表示待识别的语音信号的特征,n表示特征的数目,
表示混合t模型。
            
                    下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
                
                
            该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200810162449.2/,转载请声明来源钻瓜专利网。
- 上一篇:背光组件
 - 下一篇:用于螺旋压力弹簧的支座
 





