[发明专利]远距离语音识别中的模型域补偿新方法有效
| 申请号: | 201310201102.5 | 申请日: | 2013-05-27 |
| 公开(公告)号: | CN103258533A | 公开(公告)日: | 2013-08-21 |
| 发明(设计)人: | 杨勇;李劲松 | 申请(专利权)人: | 重庆邮电大学 |
| 主分类号: | G10L15/20 | 分类号: | G10L15/20 |
| 代理公司: | 重庆华科专利事务所 50123 | 代理人: | 康海燕 |
| 地址: | 400065 *** | 国省代码: | 重庆;85 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 远距离 语音 识别 中的 模型 补偿 新方法 | ||
技术领域
本发明涉及语音识别领域,具体涉及一种语音识别模型域补偿方法。
背景技术
语音识别是指让机器听懂人说的话,即在各种情况下,机器通过识别和理解,把人类的语音信号变成相应的文本或命令。其根本目标是研究出一种具有听觉功能的机器,这种机器能直接接受人的语音,理解人的意图,并做出相应的反应。从技术上看,它属于多维模式识别和智能技术的范畴。语音识别作为一门交叉学科,与声学、语言学、人工智能、数字信号处理、模式识别等学科有着紧密的联系,广泛应用于工业、军事、交通、医学等诸多邻域。随着近年来计算机与电子技术的发展,人们对免提设备的需求及要求越来越高,传统的语音识别不能满足人们远距离操控设备的需求。例如智能玩具、汽车自动驾驶、智能家居等,越来越人性化的商品设计,使得人们在使用这些产品的过程中更迫切地希望能解放双手,促使了远距离语音识别的发展。远距离语音识别即在传统语音识别的基础上,拉长说话人与麦克风之间的距离。由于远距离语音识别能完全避免人机交互过程中距离产生的障碍,而传统近距离的语音识别应用范围越来越窄,因此近几年来远距离语音识别发展迅猛。
远距离语音识别的应用环境可分为开阔环境和封闭环境,但大多都应用在封闭的环境中,所以本发明仅针对封闭环境下的远距离语音识别。由于在相对封闭的环境(如室内、车内)中,由于受语音在空间传播的多径效应影响,说话人的语音会产生混响效果,随之带来的语音测试集和训练集之间的不匹配,使得语音识别正确率会大幅度下降。如何在混响环境中提高语音识别正确率,以及怎样通过有效的方法提高语音识别的混响鲁棒性,成为近几年来语音识别的研究热点。本发明能方便地嵌入到语音识别网络,提高商业化语音识别产品的混响鲁棒性。
为了消除混响的影响,一般来说可以从信号域、特征域和模型域三个方面来进行处理。比如语音增强、麦克风阵列属于信号域方法,特征规整属于特征域方法,模型补偿属于模型域方法。信号域方法可以获得好的语音处理效果,但其原理复杂,传声器体积庞大且昂贵;特征规整方法应用在语音的前端处理,处理效果不如信号域理想,且过于复杂的处理算法影响系统的实时性;训练带有混响的语音数据,以及线性及非线性的模型补偿,是最近几年来的一些模型补偿新方法,但往往这些方法都没有考虑到环境因素,即缺乏环境适应性。
语音识别中的混响模型是A. Sehr等人提出的一种在模型域解混响的新方法,该方法实质是在模型域模拟混响信号的产生特点,根据实际语音分帧长度,求出房间冲击响应的帧数目,建立混响模型,利用混响模型在模型域对每一帧清晰语音模型参数补偿相同帧数目的混响补偿值。A.Sehr完成了在梅尔频率域、对数域补偿以及相应的性能分析。之后A.Sehr在混响模型基础上又提出按帧补偿的隐马尔科夫自适应方法,该方法将混响模型理论应用到隐马尔科夫自适应方法中,使得混响模型有了实际应用价值。但该方法在模型域补偿阶段对隐马尔科夫数进行的混响补偿是一种固定补偿。在实际语音识别的应用中,声源的位置是未知的,此外,若声源位置发生变动,但在模型域的混响补偿没有做相应的变化,那么补偿参数将会变得不精确,从而导致识别率不能得到有效提高。
发明内容
有鉴于此,为了解决上述问题,本发明提供一种远距离语音识别中的模型域补偿新方法,在保证远距离语音识别的同时,实现识别率的提升。
本发明的目的是这样实现的:远距离语音识别中的模型域补偿新方法,包括如下步骤:一种远距离语音识别中的模型域补偿方法, 包括步骤:应用镜像算法计算多组不同位置的房间冲击响应序列,对房间冲击响应序列进行优化,按帧提取能量参数;利用K均值聚类算法对优化后的房间冲击响应序列进行聚类,求出房间冲击响应类的混响模型,对每个混响模型应用广义逆矩阵求出均值辅助补偿矩阵和方差辅助补偿矩阵;利用清晰语音语料库训练清晰语音的隐马尔科夫模型;利用得到的辅助补偿矩阵参数,在维特比解码阶段对语音模型参数执行按帧补偿算法,按最大后验概率原则选择最佳的辅助补偿矩阵参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310201102.5/2.html,转载请声明来源钻瓜专利网。





