[发明专利]一种便携式汉语声调学习机的语音处理方法有效
申请号: | 200910089004.0 | 申请日: | 2009-07-20 |
公开(公告)号: | CN101656079A | 公开(公告)日: | 2010-02-24 |
发明(设计)人: | 霍桂馨 | 申请(专利权)人: | 霍桂馨 |
主分类号: | G10L21/06 | 分类号: | G10L21/06;G10L11/04;G05B5/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100037北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 便携式 汉语 声调 学习机 语音 处理 方法 | ||
技术领域
本发明是汉语声调学习机的核心技术。涉及语音分析的技术领域。特别是能供各种人群学习汉语声调使用,都能准确提取每次发音的基频频率值并给出声调曲线,这一技术特点,也属于语音学这个技术领域。
背景技术
汉语是一种声调语言。这也是区别于印欧语系的突出特点之一。声调也是人们学习汉语时遇到的一个大难点。要想征服它,只有反复的发音练习这一条路,没有别的捷径。任何民族的任何人都是靠无数次的反复模仿大人的语音,才学会说话的,谁都逃脱不了这一学习规律,人们为此所化学习的时间又都是漫长的。但是,成年人没有幼儿的那种时间和条件学习语言,学习效率是他们的主要矛盾。从目前人们学习汉语声调的方式看,自己多重复练习固然是一方面,解决学习条件又是主要问题。大多是在跟着复读完了标准声调之后,自己并不能知道这次复读的效果,到底是向标准声调靠近了,还是仍有很大差距?到底存在什么问题,有那个地方更须要改进。这都直接影响到学习效果。而这些问题,学习者自己本身不但无法知道,即使有老师在身边,教师也只能凭刚才的听觉印象,笼统说下,不能明确的,具体的提出指导意见,甚至有时用语言也很难说清楚该如何改进才能达到满意的效果。只有茫茫然的反复练习。
现代技术的发展,为我们以往只凭感觉学习的老传统提供了发展和完善的可能性。汉语声调学习机正是为人们提供了一个新的学习的方式,它能每次给出你刚复读的声调曲线,并和标准的比较,使你一目了然的看到自己的进步和 不足。它能随时在你身旁,绝对是个耐心无比的指导老师。你可以试探着各种方法来使自己的声调曲线向标准靠近,使你能尽快掌握汉语的声调,提高学习效率。
当然,就像通过描汉字的红模子来学习写汉语字一样,这种技术只是为人们提供了一个学习汉语声调的红模子。当然,也像对红模子的字体书写标准必然会有比较高的要求一样,这种学习机对声调曲线的准确度也同样有严格要求。有研究表明,人们对1000hz的声音,能分辨出2hz的频率差别,这就为我们设计学习机中声调频率的提取精度提供了一个具体的参照标准。这也就告诉人们,要构成一个声调学习机,它对声调中时间及基频频率的提取精度应该达到百分之一以上的量级。
回忆语音分析处理技术的发展历程,可以说,1952年,,Bell实验室搞出的语音控制英文打字机,是语音处理技术的成功的第一步。此后,相継发展了短时变换,小波变换,矢量计算,自相关计算等各种语音处理技术,这期间,直接结合在汉语应用上的,大概始于微软公司的台湾人李开复,他搞成了一种汉语声调判断的技术。其后,在美国的世界民族语言研究院搞出了汉语声调提取器;也有美国和日本的公司各自推出了汉语声调的产品。而且这些产品都相继销到了中国。但从国内引进单位所发表的文章,或是博士论文,或是著作来看,都是围绕着声调提取或声调判断方面从事研究和写文章。既便是没有引进国外产品的单位,大多也是围绕在声调的判断这个方面写文章(参见文献1)。产生这种现象的原因之一,我们认为是由于受技术,特别是受国外产品的限制。从它的说明书,操作手册等分析可看出,它们的频率提取误差应在几个赫兹(Hz)的量级,频率的提取误差大,这就必然使声调曲线误差也加大,这对发音频率比较低,调域又比较窄的声调描述就更显不妥。用这种技术制造汉语声调学习 机就会对某些人不适用。这种频率提取技术精度不高的原因之一,是受到不确定原理的限制,这点已被有些用户所认同(参见文献2)。我们认为,能判断声调和准确地描述声调,对语音处理技术的要求标准是不同的,对数据处理的精度要求自然也是不一样的。这说明,要搞成一个可供各种人群使用的汉语声调学习机,照搬国外产品是不成的,必须在处理技术上有所突破和创新。
发明内容
本发明的目的,在于克服目前“汉语声调提取器”等各产品存在的缺欠,提供一种可以突破不确定原理限制,能准确提取出时间和基频的语音处理技术。
本发明所提出的处理技术,有以下几个方面:
1)不要求必须在线处理数据,但是,要保证能在,一个可接受的,时间差后,“马上”显示语音数据处理结果,也可称“立刻”显现声调曲线。
2)记录下语音信号后,首先经过预处理环节,其目的在于:
A、对记录语音信号“掐头”“去尾”,以去掉非稳定的语音信号;
B、初步分析,以确定使用者声音频率的范围;
C、通过自我复制,加大原始语音的数据量,以提高基频的提取精度。
3)用特定的数据处理流程和特定的数字式泸波器类型分析数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于霍桂馨,未经霍桂馨许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910089004.0/2.html,转载请声明来源钻瓜专利网。