[发明专利]利用语音特征将英文单词发音按音节分开的装置与方法无效
申请号: | 201210423149.1 | 申请日: | 2012-10-29 |
公开(公告)号: | CN103794208A | 公开(公告)日: | 2014-05-14 |
发明(设计)人: | 王秦秦 | 申请(专利权)人: | 无敌科技(西安)有限公司 |
主分类号: | G10L15/02 | 分类号: | G10L15/02 |
代理公司: | 西安智邦专利商标代理有限公司 61211 | 代理人: | 倪金荣 |
地址: | 710075 陕西省*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 语音 特征 英文单词 发音 音节 分开 装置 方法 | ||
技术领域
本发明涉及一种切分单字语音特征的装置与方法,尤其是一种利用语音特征将英文单词发音按音节分开的装置与方法。
背景技术
近来电子辞典标榜具有真人发音的功能,已成为各厂商所诉求的特色。而真人发音可通过真人来录制各个单字的声波,而达到真人发音的功能。然而,利用真人来录制所有单字的声波,将耗费掉电子辞典内存非常多的储存空间,进而提升成本的支出。
依照英文辞典单字表中的音标来决定音节。在合成一个英文单字的语音数据前,必须先将此英文单字切分为单个或多个音节,再由原始录音的数据中获取出与音节相对应的声波,并加以结合即可。
录制所有各种声母、韵母及音调组合的各个音节声波,并储存在内存中。在合成一个英文单字的语音数据前,必须先将此英文单字切分为单个或多个音节,再由录制的数据中获取出与切分后的各个音节相对应的声波,并加以结合即可。
由上述说明可知,不论是哪种发音合成的方式,都必须先将英文单字切分为单个或多个音节,才能进行后续的处理。而传统的作法上,是通过人耳听音而利用手工切分。如此,需投入大量的人力与工时才能完成。另外,手工切分音节的工作枯燥、数量庞大,且采用人耳听音而作音节的切分,极易产生误差。
因此,如何解决传统上人工切分单字语音所衍生的问题,为亟待解决的议题。
发明内容
本发明为解决背景技术中存在的上述技术问题,而提出一种利用语音特征将英文单词发音按音节分开的装置与方法。
本发明的技术解决方案是:本发明为一种利用语音特征将英文单词发音按音节分开的装置,其特殊之处在于:该装置包括:输入模块,输入语音特征,划分模块,将单字按语音特征划分;检索模块,根据语音特征检索候选音节;选取模块,从候选音节中选取音节;切分模块,切分单字语音特征为音节;特征接受模块,接受切分的新的语音特征。
上述检索模块根据语音特征产生阀值,通过切分模块对比语音特征与阀值。
一种实现上述利用语音特征将英文单词发音按音节分开装置的方法,其特殊之处在于:该方法包含下列步骤:
1)输入单字语音特征;
2)将单字按语音特征划分;
3)根据语音特征检索候选音节;
4)从候选音节中选取音节;
5)切分单字语音特征为音节;
6)特征接受模块,接受切分的新的语音特征。
根据上述语音特征产生阀值,对比语音特征与阀值。
附图说明
图1为利用语音特征将英文单词发音按音节分开的装置示意图;
具体实施方式
参见图1,利用语音特征将英文单词发音按音节分开的装置包含:输入模块10、检索模块20及切分模块30、选取模块40、划分模块50、特征接受模块60。
输入模块10输入单字语音特征,并将单字语音特征划分为多个音框。检索模块20分析多个音框,并产生对应于每一个音框的语音特征。切分模块30根据检索模块20所分析出的语音特征,进而切分单字语音特征为音节。
每个单字的语音特征不会完全相同,但具有一些共同的特性,例如:多音节单字的发音是由各个音节所组成;音节组成在语音特征上有特定的规律可循;利用语音特征可进行音节切分等。因此,本发明提出先将单字语音特征划分为多个音框,然后以每一个音框为单位,利用检索模块20分析出每一个音框的语音特征。
语音特征的振幅所指的即为语音特征的大小,如同人类说话一般会有高低起伏,所以语音特征的波形所呈现出来的也会有高低或强弱之分。而振幅便是代表语音特征的大小,而平均振幅值,便是将所有音框的振幅值加总后再做平均,如此可看出单位时间内,某段语音特征与整段语音特征相比的信号强弱分布。
因此过零率简单的说,便是语音特征在单位时间过零的次数。而过零率应用广泛,尤其在语音辨识方面。过零率高的区段对应于清音或无声区。相对的,噪声较高,过零率较低的区段对应于浊音。由此可知,通过判断过零率即可区别语音特征中的清音与浊音、有声与无声等。
因此,本发明通过分析语音特征,再通过切分模块30根据语音特征而达到利用语音特征将英文单词发音按音节分开为单个或多个音节。其中,检索模块20可根据语音特征产生阀值,利用阀值可判断是否为音节的切分点。当单字语音特征的音框语音特征低于阀值时,即表示该音框为音节的切分点。因此,当检索模块20产生阀值后,切分模块30对比语音特征与阀值,进而将单字语音特征切分为单个多个音节,选取模块40,从候选音节中选取音节。特征接受模块50,接受切分的新的语音特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于无敌科技(西安)有限公司,未经无敌科技(西安)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210423149.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:播放多媒体档案的方法及装置
- 下一篇:学习装置与掌上学习装置显示系统和方法