[发明专利]远距离语音识别中的模型域补偿新方法有效

申请号：	201310201102.5	申请日：	2013-05-27
公开（公告）号：	CN103258533A	公开（公告）日：	2013-08-21
发明（设计）人：	杨勇;李劲松	申请（专利权）人：	重庆邮电大学
主分类号：	G10L15/20	分类号：	G10L15/20
代理公司：	重庆华科专利事务所 50123	代理人：	康海燕
地址：	400065 ***	国省代码：	重庆;85
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	远距离语音识别中的模型补偿新方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.远距离语音识别中的模型域补偿方法, 其特征在于：包括步骤：应用镜像算法计算多组不同位置的房间冲击响应序列,对房间冲击响应序列进行优化，按帧提取能量参数；利用K均值聚类算法对优化后的房间冲击响应序列进行聚类，求出房间冲击响应类的混响模型，对每个混响模型应用广义逆矩阵求出均值辅助补偿矩阵和方差辅助补偿矩阵；利用清晰语音语料库训练清晰语音的隐马尔科夫模型；利用得到的辅助补偿矩阵参数，在维特比解码阶段对语音模型参数执行按帧补偿算法，按最大后验概率原则选择最佳的辅助补偿矩阵参数。

2.根据权利要求1所述的模型域补偿方法, 其特征在于：计算多组不同位置的房间冲击响应序列具体包括，输入房间的空间大小参数、吸声系数、麦克风坐标以及声源坐标，将上述参数作为镜像算法的输入参数，计算房间冲击响应序列，一个声源坐标对应生成一组房间冲击响应序列。

3.根据权利要求1所述的模型域补偿方法, 其特征在于：对房间冲击响应序列进行优化具体为，删除房间冲击响应序列尾部数据，保证各个房间冲击响应序列的长度为5120点；对房间冲击响应序列进行分帧，分帧长度为160点为一帧；对每一帧房间冲击响应执行按帧求和运算，得到新的房间冲击响应特征序列。

4.根据权利要求1所述的模型域补偿方法, 其特征在于：利用K均值聚类算法对房间冲击响应序列进行聚类，将同一类的房间冲击响应序列按行合并为矩阵，每一类对应一个房间冲击响应矩阵。

5.根据权利要求1所述的模型域补偿方法, 其特征在于：对房间冲击响应矩阵实施时频域转换，得到梅尔频率域的混响模型；辅助矩阵为真实混响语音参数与估计混响语音参数乘积的广义逆矩阵，用以消除两者之间的误差；利用辅助矩阵与混响模型参数相乘的均值得到均值补偿矩阵，利用辅助矩阵与混响模型参数相乘的结果与均值矩阵的差值的均值得到方差补偿矩阵。

6.根据权利要求1所述的模型域补偿方法, 其特征在于：训练过程中采用多次分裂隐马尔科夫模型，对每一个隐马尔科夫状态中的输出概率模型，都是一个独立的高斯混合模型。

7.根据权利要求1所述的模型域补偿方法, 其特征在于：在维特比解码阶段对语音模型参数执行按帧补偿算法具体为：将混响模型的均值与方差按帧地叠加到当前帧清晰语音模型的均值与方差矩阵上；将混响模型的均值从梅尔频率域转到梅尔倒谱域，转换方法为：从梅尔频率域经过离散余弦变换然后取对数得到梅尔倒谱域模型；反之，从梅尔倒谱域经过逆离散余弦变换和指数运算得到梅尔频率域模型；在补偿阶段，选择出最佳的混响模型补偿类的均值与方差对模型参数进行补偿。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于重庆邮电大学，未经重庆邮电大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201310201102.5/1.html，转载请声明来源钻瓜专利网。

上一篇：一种从废弃聚氨酯材料中回收多元醇的方法
下一篇：飞机蒙皮涂料用氟有机硅双改性丙烯酸树脂材料

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]远距离语音识别中的模型域补偿新方法有效

专利文献下载