[发明专利]计算机辅助语言学习系统中的发音质量评价方法有效
申请号: | 200810102076.X | 申请日: | 2008-03-17 |
公开(公告)号: | CN101246685A | 公开(公告)日: | 2008-08-20 |
发明(设计)人: | 刘加 | 申请(专利权)人: | 清华大学 |
主分类号: | G10L11/00 | 分类号: | G10L11/00;G10L19/00;G09B19/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100084北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算机辅助 语言 学习 系统 中的 发音 质量 评价 方法 | ||
技术领域
本发明属于语音技术领域,具体地说,涉及利用语音信号处理技术实现计算机辅助语言学习系统中语音发音质量评价的方法。
背景技术
在学习者进行语言学习时,对其发音质量进行可靠的评价是计算机辅助语言学习系统的核心功能。然而由于现有技术的局限,目前的发音质量评价方法的性能还不够理想,距离实用化还有一定的差距。
当前,利用计算机对发音质量进行评价的方法主要是基于隐含马尔可夫模型(HMM)。中国发明专利申请第200510114848.8号公开了一种用于学习机的发音质量评价方法。该方法采用隐含马尔可夫模型训练标准发音模型,并搜索最优路径,以此计算用来评价发音质量的置信分数。这种方法过多依赖于隐含马尔可夫模型的训练,并且在影响发音质量的多个因素中,仅基于与声学模型有关的因素来评价发音质量,因此与专家评分的相关性还不够高,对单词和短句发音机器评分和专家评分的相关性仅为0.74。
在通信系统中也涉及语音质量的评价。ITU-T P.862中公开了一种用于电话信道的语音质量评价方法。首先将参考语音通过电话信道得到测试语音。然后将参考语音和测试语音映射到感知域,精确估计出测试语音相对于参考语音的延时,最后在感知域计算测试语音相对于参考语音的感知差异,并以此来评价测试语音的语音质量。
然而,通信系统中的语音质量评价方法和计算机辅助语言学习系统中的发音质量评价有所不同。首先,在语音通信系统中,影响语音质量的因素一般是电话信道、编解码器引起的各种噪音对语音的损伤以及网络对语音的延时。参考语音和测试语音都是同一个说话人的同一句语音,因此如果不考虑延时,测试语音中的各个音素一般不会有段长的变化。一个人语音发音是否正确对通信系统的语音质量评价过程不会产生影响。而在计算机辅助语言学习系统中,影响发音质量的因素比较复杂。学习者的测试语音的失真是由于发音不准确造成的,和噪声没有多大关系。并且如果将教师的发音作为参考语音,学习者的语音作为测试语音,来考察测试语音相对于参考语音的发音质量。那么参考语音和测试语音来自不同的说话人,导致测试语音和参考语音的长度不同,并且这一语音长度的差异不是延时造成的,因此无法直接对准。其次,不同说话人的声道长度不同,导致测试语音和参考语音中同一音素的共振峰不完全一样。另外,两个说话人语音中的韵律变化也有所不同,其直接表现就是测试语音和参考语音的重音变化。两个人的基音也不相同,对应基音变化过程也有比较大的差异。
计算机辅助语言学习系统应尽可能模仿专家对发音质量评价的过程。通常,专家对发音质量进行评价的过程可以划分为三个步骤。首先,通过耳机或者音箱聆听测试语音。然后,大脑对感知到的语音进行处理,并根据自己的语音学和语言学知识,将参考语音和测试语音进行对比,发现测试语音在各个层次(例如声学层和韵律层)上的发音错误和失真。最后,综合上述各种失真,给出测试语音的总体评价。可见,对发音质量的感知与发音质量评价的结果密切相关。而现有技术未能在韵律层次上对发音质量进行评价,并且缺乏对发音质量的感知失真方面的研究。
本发明针对现有技术中存在的问题,提出一种计算机辅助语言学习系统中的发音质量评价方法。该方法以教师的发音作为参考语音,分别在声学、感知和韵律方面计算学习者的测试语音相对于参考语音的发音质量差别,得到匹配分数、感知分数、段长分数和基音分数,并对所述四种分数进行融合,得到测试语音的最终分数。根据本发明针对单词和短句的发音质量评价分数与专家评分的相关系数达到0.800,性能优于基于现有技术的方法。
发明内容
目前基于隐含马尔可夫模型的发音质量评价方法获得机器评价分数与专家评分的相关性还不够高,不能够满足目前计算机辅助语言学习系统中对发音质量评价要求。本发明的目的是克服现有技术的不足,提出一种用于计算机辅助语言学习系统中的发音质量评价方法。本发明中提出利用教师的参考语音和学生的测试语音分别从声学、感知和韵律方面计算匹配分数、感知分数、段长分数、基音分数,并将所述这些分数映射后进行融合来对发音质量进行评分的方法,针对单词和短句子的机器发音质量评分与专家主观质量评分的相关性能够达到0.800。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810102076.X/2.html,转载请声明来源钻瓜专利网。