[发明专利]基音同步波形叠加汉语文语转换系统无效
| 申请号: | 94107920.1 | 申请日: | 1994-08-01 |
| 公开(公告)号: | CN1118493A | 公开(公告)日: | 1996-03-13 |
| 发明(设计)人: | 吕士楠;初敏;关定华 | 申请(专利权)人: | 中国科学院声学研究所 |
| 主分类号: | G10L5/04 | 分类号: | G10L5/04 |
| 代理公司: | 铁道部科技情报所铁路专利咨询服务中心 | 代理人: | 王国朴 |
| 地址: | 100080*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基音 同步 波形 叠加 汉语 转换 系统 | ||
本发明涉及语言合成技术。
目前,国内外语音合成技术主要有参数合成技术和波形合成技术两种。参数合成技术从理论上讲是最合理的,但这种技术过分依赖于语言学和语音学的发展,由于言语生成模型不够完善,合成语音的音质总是不尽人意。波形拼接技术当用于语音表或公共汽车报站器等有限词汇合成时,能合成出清晰、自然的语音。但简单的波形拼接法用于无限词汇的汉语文语转换系统时,由于不能改变原始采样波形的声学参数以使其适应于不同的上下文语言环境,使得合成出的连续语音的自然度很差。因为即使汉语单音节的发音非常清晰,但一字一顿地读文章,总是难以让听众乐于接受。为提高自然度,北方交通大学信息研究所研制的汉语合成系统,在音库中除了容纳一千三百个左右的汉语基本音节的波形采样值外,还加入了近一万个常用词的波形采样值作为拼接单元。该系统的合成语音比孤立音节拼接出的语音的自然度有所提高,但仍然不理想。因为在自然语言中即使是词,其发音特征,特别是音高、音长和音强等韵律特征受上下文的影响也很大。如果合成时千篇一律的采用同一发音,在大多数语言环境中都是不自然的。而汉语词的数目很大,做每词一种发音的常用词音库已不容易,开发一个具有多种发音的大词汇语音库,目前几乎是不可能的。清华大学计算机系研制的汉语合成系统虽然以单音节为拼接单元,但同一音节存“重读”和“轻读”两种发音,同时还存入轻声音节。用这个系统合成的孤立词听起来比较自然,但合成的连续语言的自然度不高。仍然无法对音高、音长和音强等韵律特征进行全局控制。简单的将一音节分为重读和轻读还是不能形成自然的语调,因而合成出的连续语音的自然度仍然达不到实用要求。
总之,在已有的汉语合成技术中,参数合成虽然可以灵活调节韵律特征,但参数设置困难,合成语音的清晰度还不能令人满意。而已有的简单的波形拼接合成,音节或词可以听得很好,但由于不能随意控制合成语音的韵律特征,使得合成语音的自然度不高,很难为公众所接受。
本发明的目的是提供一种高清晰度和高自然度的汉语文语转换系统。该系统以基音同步波形叠加技术为基础,以汉语单音节为合成单元,有一个具有词调模式、重音模式和句调模式,能对输入文本进行词一级和句一级处理,从而通盘规划一句话中各音节的音高、音长和音强等韵律特征的韵律规则库。它能将带有少量韵律符号的汉语文本转换成流畅的具有新闻广播风格的汉语口语输出,为计算机提供了新的人机接口。它还可用于机场、码头和车站的自动播音系统,各种信息自动资询系统,残疾人的助讲、助读以及办公自动化系统等方面。
本发明的技术方案是按下述步骤实施的。
1.利用汉语音节的独立性较强和音节数目有限的特点,以音节为合成单元,建立由汉语全部基本音节采样值及其基音同步标记构成的语音库。
2.建立一个具有词调模式、重音模式和句调模式构成的,能对一句话中各音节的音高、音长和音强等韵律特征进行词和句两个层次的韵律调节的韵律规则库。
3.利用基音同步波形叠加技术,对从语音库中取出的音节波形按韵律规则进行音长、音高和音强调节。
4.将调节后的音节波形拼接成语句,使其能输出语音清晰、流畅、自然的连续语音。
结合附图对本发明详细描述如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所,未经中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/94107920.1/2.html,转载请声明来源钻瓜专利网。





