[发明专利]一种基于发音节奏的语音评测方法及装置有效
申请号: | 201210473420.2 | 申请日: | 2012-11-20 |
公开(公告)号: | CN103021226A | 公开(公告)日: | 2013-04-03 |
发明(设计)人: | 张劲松;时书菊;解焱陆 | 申请(专利权)人: | 北京语言大学 |
主分类号: | G09B19/06 | 分类号: | G09B19/06 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 郭智 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 发音 节奏 语音 评测 方法 装置 | ||
技术领域
本发明涉及语音识别领域,特别涉及一种基于发音节奏的语音评测方法及装置。
背景技术
日常生活中,我们不难发现这样的现象:日本学生的汉语发音节奏往往会受到母语的影响,与汉语母语发音者存在着很大的不同。而研究表明,对日本学习者而言,最难的部分即为汉语口语的学习。如果能及时发现日本学生汉语发音节奏中的偏误并给予他们有效地反馈,将会对他们的大大提高他们的汉语口语学习效率。
然而随着汉语热的进一步升温,学习汉语的人数在急剧增加,传统的教学资源有限,并且不能及时发现学生汉语发音节奏中的偏误,无法满足学生的需要。
发明内容
本发明的目的是针对上述问题,考虑到第二语言学习者口语发音节奏往往会受到母语发音节奏的影响,提出一种基于发音节奏的语音评测方法及装置。
为实现上述目的,本发明提供了一种基于发音节奏的语音评测装置,该装置包括:
GMM模型获取单元,用于从被评测语音中选出训练数据,提取出所述训练数据的节奏特征参数进行训练得到GMM模型;
似然度获取单元,提取被评测语音的节奏特征参数作为所述GMM模型的输入,经GMM模型匹配获取相应的似然度值;
评测模型获取单元,包括评测模型模块,用于所述似然度经过训练评测模型,根据所述评测模型对被评测语音的发音节奏进行评测。
可选的,在本发明一实施例中,所述评测模型获取单元还包括标准化处理模块;
所述标准化处理模块用于似然度经过训练获取评测模型之前经过标准化处理;所述标准化处理包括:求解信差和Z-Score值。
可选的,在本发明一实施例中,所述评测模型模块中的评测模型为LDA模型。
可选的,在本发明一实施例中,所述GMM模型获取单元获取的GMM模型包括中国人说汉语GMM模型、日本人说汉语GMM模型和日本人说日语GMM模型。
可选的,在本发明一实施例中,所述GMM模型获取单元获取的GMM模型还用于对被评测语音进行类型识别,即被评测语音作为输入经过GMM模型获取似然度值,将获取最大似然度值的GMM模型对应的语料类型作为被评测语音的类型。
可选的,在本发明一实施例中,所述语料类型包括中国人说汉语类型、日本人说汉语类型和日本人说日语类型。
可选的,在本发明一实施例中,所述GMM模型获取单元中的节奏特征参数包括:%V、ΔV、rPVI、nPVI和ΔE;其中,
所述%V为在一句话中所有元音的时长占总时长的比例;
所述ΔV为在一句话中元音时长的标准差;
所述ΔE为一句话中辅音/元音能量值的标准差;所述ΔE表达式为:
其中,n表示一句话中总的元音或者辅音个数;i表示第i个元音或者辅音;Ei表示第i个元音或者辅音的能量值;表示一句话中元音或者辅音能量的平均值;
所述rPVI为相邻两元音段或辅音段之间的时长差的平均值;所述rPVI表达式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京语言大学,未经北京语言大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210473420.2/2.html,转载请声明来源钻瓜专利网。