[发明专利]一种用于语种识别的语种模型的训练方法及系统有效

申请号：	201210560716.8	申请日：	2012-12-20
公开（公告）号：	CN103065622A	公开（公告）日：	2013-04-24
发明（设计）人：	周若华;颜永红;杨金超;索宏彬	申请（专利权）人：	中国科学院声学研究所;北京中科信利技术有限公司
主分类号：	G10L15/06	分类号：	G10L15/06;G10L19/032
代理公司：	北京亿腾知识产权代理事务所 11309	代理人：	陈霁
地址：	100190 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种用于语种识别模型训练方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种用于语种识别的语种模型的训练方法，其特征在于，所述方法包括：

采集多个目标语种语音数据，提取各语种的语音声学谱特征；

利用所述声学谱特征训练每个目标语种的高斯混合模型，作为其初始模型；

利用每个目标语种的初始模型量化对应语种训练数据的混淆度；

利用最大后验估计将各语种训练数据从声学谱特征转换到高斯超向量空间；

对所述各语种训练数据的高斯超向量空间，根据所述混淆度赋予各语种训练数据的高斯超向量不同的权重，并利用权重较高的几个语种的训练数据来训练语种模型。

2.如权利要求1所述的用于语种识别的语种模型的训练方法，其特征在于，所述利用权重较高的几个语种的训练数据来训练语种模型，具体为：利用权重较高的几个语种的训练数据的高斯超向量进行最大似然估计得到代表每个语种高斯超向量空间分布的中心点，根据每个语种高斯超向量空间分布的中心点，更新每个语种的高斯混合模型的均值，得到每个语种的新的高斯混合模型。

3.如权利要求1或2所述的用于语种识别的语种模型的训练方法，其特征在于，所述利用每个目标语种的初始模型量化对应语种训练数据的混淆度，具体为：若语种1_i的某条语音数据的声学谱特征为X，该条语音数据混淆度H(X)=1h(X),0=<h(X)<=ϵ0,h(X)>ϵ,(X)<0,]]>其中ε为正常数，h(X)=F(X/li)-Maxlj∈L,lj≠li{F(X/lj)},]]>Max{}为求最大值函数，F(X/1)为该声学谱特征X在语种l的初始模型的对数似然得分，即其中N为语种l的初始模型的高斯混合数，w，m，∑分别为语种l的初始模型的权重，均值和方差。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;北京中科信利技术有限公司，未经中国科学院声学研究所;北京中科信利技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201210560716.8/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种用于语种识别的语种模型的训练方法及系统有效

专利文献下载