[发明专利]一种基于矢量泰勒级数的多环境模型孤立词识别方法在审
申请号: | 201410676529.5 | 申请日: | 2014-11-21 |
公开(公告)号: | CN104485103A | 公开(公告)日: | 2015-04-01 |
发明(设计)人: | 周琳;束佳明;吕勇;吴镇扬 | 申请(专利权)人: | 东南大学 |
主分类号: | G10L15/14 | 分类号: | G10L15/14 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 杨晓玲 |
地址: | 214000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于矢量泰勒级数的多环境模型孤立词识别方法,通过模型训练阶段:设置基本环境信噪比,利用含噪训练语音分别训练生成含噪GMM模型和含噪HMM模型;通过孤立词识别阶段,根据训练阶段获得的含噪GMM模型,首先选择与当前测试环境最匹配的信噪比环境;其次基于矢量泰勒级数和纯净环境下的纯净GMM模型,估计测试语音中噪声的均值和方差,并根据最小均方误差准则将测试语音特征参数映射到最匹配信噪比环境下的含噪语音特征参数;最后,选择最匹配信噪比环境下的含噪HMM模型,将映射后的含噪特征参数与对应的含噪HMM模型进行匹配,得到最终的识别结果。本发明误识率比现有矢量泰勒级数大幅降低。 | ||
搜索关键词: | 一种 基于 矢量 泰勒 级数 环境 模型 孤立 识别 方法 | ||
【主权项】:
一种基于矢量泰勒级数的多环境模型孤立词识别方法,其特征在于,该方法包括以下步骤:1)模型训练阶段:设置基本环境信噪比,对白噪声进行加权,将加权结果加载到纯净训练语音中,分别得到对应信噪比条件下的含噪训练语音;利用含噪训练语音分别训练生成含噪GMM模型和含噪HMM模型;其中含噪GMM模型表示每一信噪比环境下所有孤立词的特征参数分布,含噪HMM模型表示每一信噪比环境下每个孤立词的特征参数分布;2)孤立词识别阶段:根据训练阶段获得的含噪GMM模型,基于最大似然准则选择与当前测试环境最匹配的信噪比环境,然后基于矢量泰勒级数和纯净环境下的纯净GMM模型,估计测试语音中噪声的均值和方差;接着基于最小均方误差估计准则和最匹配信噪比环境下的含噪GMM模型,将测试环境下的含噪语音特征参数映射到最匹配信噪比环境下的含噪特征参数;最后识别时,选择最匹配信噪比环境下的含噪HMM模型,将映射后的含噪特征参数与对应的含噪HMM模型进行匹配,得到最终的识别结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410676529.5/,转载请声明来源钻瓜专利网。
- 上一篇:电压产生电路和存储器
- 下一篇:一种基于模板自动生成音乐旋律的方法