[发明专利]一种拼音拼读的发音质量评测系统在审
申请号: | 201510904230.5 | 申请日: | 2015-12-09 |
公开(公告)号: | CN106856095A | 公开(公告)日: | 2017-06-16 |
发明(设计)人: | 王丽;张鹏远;刘建;颜永红 | 申请(专利权)人: | 中国科学院声学研究所;北京中科信利技术有限公司 |
主分类号: | G10L25/93 | 分类号: | G10L25/93;G10L25/90;G10L15/02;G10L17/08 |
代理公司: | 北京方安思达知识产权代理有限公司11472 | 代理人: | 王宇杨,刘振 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 拼音 拼读 发音 质量 评测 系统 | ||
技术领域
本发明属于计算机辅助学习领域,尤其涉及一种拼音拼读的发音质量评测系统。
背景技术
近年来随着我国国际地位的不断提高和国际交往的日益广泛,世界各国对于汉语学习的需求急剧增长。汉语是世界上使用人口最多的语言,也是联合国规定的六种工作语言之一,它正在受到越来越多的国家政府、教育机构、企业以及传媒的重视。据统计,学习汉语的外国人每年大幅度增长,目前全世界有近100个国家的2000多所大学在教授汉语,英、泰、印尼等国更把汉语纳入正规教育体系,全球学习汉语的人数达到近3000万,预计数年后全球学习汉语的人数将达一亿人。
1958年2月,第一届全国人民代表大会第五次会议通过了《汉语拼音方案》,之后的50多年内,汉语拼音经过了多次试验和改革,才发展定型为现在的“教材”。现在汉语拼音已经成为学习汉字、学习普通话、培养和提高阅读及写作能力的重要工具。汉语拼音由26个拉丁字母组成,包括21个声母和39个韵母。
汉语拼音的教学,最开始是按照《汉语拼音方案》施行的,但是在教学的过程中,广大语文教学工作者发现让初学者掌握复杂的拼写规则有很大的难度。于是,在教学实践中,教学工作者不断探索科学有效的教学方法,不断改进教材,使其更加适应初学者的特点,减轻初学者的压力。其中拼音拼读的方式是教学工作者很关注的问题,因为合理的拼读方式可以帮助初学者循序渐进的学好汉语拼音。
经过教学工作者不断的改进,目前的拼音拼读方式主要有四种:声韵两拼法、声介合拼法,三拼连读法和直呼法。其中,声韵两拼法是最常用、最有效的拼读方式。
声韵两拼法是指音节按照声母、韵母依次朗读完后再整读的方式,如:b+an4=ban4,q+iang3=qiang3等。现在教学中一般只有声母和韵母的两拼音节,多采用声韵两拼法,因为这种方式拆分简单,容易掌握,只需注意声母轻短,韵母较重,声母读本音,韵母直接带调读等诀窍就可以了。
自上世纪90年代开始,国内很多研究机构和学者针对汉语的发音质量评测进行了相关的研究,也涌现了很多实用的系统。但是,传统的发音质量评测主要是针对整读或者朗读段落的形式,评测单元较大,无法很好地对独立的声母或者韵母层面 上的发音优缺点进行详细的评价。
发明内容
本发明的目的在于克服目前的拼音发音质量评测存在的无法对独立的声母或者韵母层面上的发音优缺点进行评价的缺陷,提出了一种拼音拼读的发音质量评测系统,该系统在语音识别的框架下,利用发音质量评测技术和音调评测技术,能够在单独的声母、韵母及整读层面上分别进行评价,有效地辅助用户学习汉语拼音。
为实现上述目的,本发明提供了一种拼音拼读的发音质量评测系统,所述系统包括:前端处理模块、强制对齐模块、发音评测模块、声调评测模块和评测输出模块;
所述前端处理模块,用于对输入的拼音拼读语音进行端点检测、声学特征的提取及规整;
所述强制对齐模块,用于使用强制对齐技术把所述前端处理模块处理后的语音切分为若干个音素段,获取每个音素的开始时间和截止时间;并将得到的音素段输入所述发音评测模块和声调评测模块;
所述发音评测模块,用于利用发音良好度计算每段音素的后验概率;作为衡量音素发音质量的测度;将该值输出到所述评测输出模块;
所述声调评测模块,用于对每段音素的声调进行识别,并判断识别结果与正确声调是否一致,给出声调质量的评估值,将该值输出到所述评测输出模块;
所述评测输出模块,用于对音评测模块和声调评测模块输出的评测结果进行综合,得到整体的评测结果,并反馈给用户,使用户能够根据评测结果进行针对性的纠正和练习。
上述技术方案中,所述前端处理模块的端点检测为检测出输入的拼音拼读语音的开始时间点和结束时间点。
上述技术方案中,所述发音评测模块中的利用发音良好度计算每段音素的后验概率的具体过程为:
利用下式计算音素qi的后验概率:
其中,O为语音特征序列;p(O|qi)为在音素qi下观察到O的概率;J为系统所 有音素的个数;NF(O)为语音特征序列的段长。
上述技术方案中,所述声调评测模块中对每段音素的声调进行识别的具体过程为:根据强制对齐模块得到的各音素段的开始时间和截止时间,计算韵母的基频序列,并提取声调特征;然后利用混合高斯模型对声调特征进行分类,得到声调的识别结果。
本发明的优势在于:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;北京中科信利技术有限公司,未经中国科学院声学研究所;北京中科信利技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510904230.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于前向神经网络语言模型的汉语语音关键词检索方法
- 下一篇:催眠音乐播放器