[发明专利]一种汉语韵律词组词方法及装置有效
| 申请号: | 200610167040.0 | 申请日: | 2006-12-13 |
| 公开(公告)号: | CN101202041A | 公开(公告)日: | 2008-06-18 |
| 发明(设计)人: | 郭庆;片江伸之 | 申请(专利权)人: | 富士通株式会社 |
| 主分类号: | G10L13/00 | 分类号: | G10L13/00;G10L13/08;G10L13/06 |
| 代理公司: | 北京三友知识产权代理有限公司 | 代理人: | 任默闻 |
| 地址: | 日本神奈*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 汉语 韵律 词组 方法 装置 | ||
技术领域
本发明涉及汉语语音合成技术,特别涉及汉语语音合成系统中对汉语输入句子进行韵律词组词的处理技术,具体的讲是一种汉语韵律词组词方法及装置。
背景技术
当汉语中多个字组成词或词组而连续发音时,它们之间将会相互影响,形成较独立、完整的韵律块,这些韵律块的韵律特征对语音的自然度起着非常重要的作用,而不同韵律块组合在一起,往往可以形成不同的语调,使人的发音具有不同的语气。一般来说,汉语语音中主要韵律单元有:韵律词、韵律短语、语调短语。汉语的韵律是具有层次结构的,这种层次性的韵律结构形成了汉语语音的节奏(韵律)。韵律单元的边界往往对应于语音中韵律边界音节的停顿、基频变化或者音长变化。韵律是影响合成语音自然度和可懂度的一个重要因素。在语音合成系统中,韵律结构为韵律参数预测模型提供最重要的信息,通过对基频、音长、停顿等参数的预测,来达到控制语音合成系统发音方式的目的,从而在合成语音中实现各级韵律单元的相应韵律效果,使之发音自然、好听。
随着言语处理的不断深入,人们不但越来越需要了解自然话语的韵律结构,而且力图寻找从文本预测韵律结构的方法,以便更加有效地提高合成语音的自然度或语音识别的准确率,同时加深自然语言理解的程度。
韵律词指语音流中连续发音的一组音节,这些音节之间发音非常紧密且其中没有听感上的停顿。韵律词是韵律层次结构中最低一级的要素,一般来说在韵律词边界有可感知的停顿。换句话说,在韵律词内部没有可感知的停顿,而停顿只能出现在韵律词边界处。在真实的语音中,不是所有的韵律词边界都有停顿。如果在韵律词边界有可感知的停顿是可接受的,但是,任何韵律词内部的可感知的停顿会导致语音难以理解或者不自然。因此,一个良好的韵律词组词模块对于增加合成语音的自然度具有极其重要的意义。
在现有技术中,关于韵律词组词模块及其增加合成语音自然度的研究存在多篇公开的论文和专利,例如:
美国专利6,996,529(Minnis;Stephen;February 7,2006,Speech synthesiswith prosodic phrase boundary information);
美国专利6,173,262(Hirschberg;Julia;January 9,2001,Text-to-speechsystem with automatically trained phrasing rules);
美国专利6,003,005(Hirschberg;Julia;December 14,1999,Text-to-speechsystem and a method and apparatus for training the same based upon intonationalfeature annotations of input text);
美国专利5,850,629(Holm;Frode;Pearson;Steve;December 15,1998,Userinterface controller for text-to-speech synthesizer);
美国专利6,978,239(Chu;Min;Peng;Hu;December 20,2005,Method andapparatus for speech synthesis without prosody modification);
文献,Shih,C.L.,“The Prosodic Domain of Tone Sandhi in MandarinChinese”,PhD Dissertation,UC San Diego,1986;
文献,Chu M.and Qian Y.,“Locating boundaries for prosodic constituents inunrestricted Mandarin texts”,Journal of Computational Linguistics and ChineseLanguage Processing,6(1),61-82,2001;
文献,Dong H.,Tao J.and Xu b.,“Prosodic word prediction using the lexicalinformation”,International Conference on Natural Language Processing andKnowledge Engineering,Wuhan,2005;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200610167040.0/2.html,转载请声明来源钻瓜专利网。





