[发明专利]语音合成设备有效
申请号: | 201210179123.7 | 申请日: | 2012-06-01 |
公开(公告)号: | CN102810310A | 公开(公告)日: | 2012-12-05 |
发明(设计)人: | 才野庆二郎 | 申请(专利权)人: | 雅马哈株式会社 |
主分类号: | G10L13/04 | 分类号: | G10L13/04 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 陈源;张天舒 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 合成 设备 | ||
技术领域
本发明涉及一种用于将多个语音段互连以合成一个诸如谈话语音或歌唱语音之类的语音的技术。
背景技术
在用于将多个语音段互连以合成期望语音的语音段连接类型语音合成技术中,将语音段扩展和压缩到目标时间长度是必要的。日本专利申请公开No.H7-129193公开了这样一种结构,其中将多种语音段分类为稳定部分和过渡部分,并在正常部分和过渡部分中分别对每个语音段的时间长度进行调整。例如,将正常部分扩展和压缩得比过渡部分更大。
在日本专利申请公开No.H7-129193的技术中,在被分到正常部分或过渡部分中的语音段的范围内,时间长度是以固定的扩展和压缩率来调整的。然而,在实际发音时,扩展的程度会以一个片段接一个片段为基础发生变化,甚至在一个语音段(音素)范围内也如此。因此,在日本专利申请公开No.H7-129193的技术中,在扩展语音段的情况中将会合成出听起来不自然的语音(即,与实际发出的声音不同的语音)。
发明内容
已经考虑到上述问题作出了本发明,并且本发明的一个目的是即使在扩展语音段的情况中也能合成听起来自然的语音。
将要描述的是为了解决上述问题而在本发明中所采用的手段。同时,在以下描述中,为了便于理解本发明,与本发明各组件对应的实施例中的组件在括号中显示;然而本发明的范围并不限于所述实施例。
根据本发明第一方面的语音合成设备被设计来用于使用多个语音段数据合成语音信号,每个语音段数据表示含有至少两个对应于不同音素的音素片段(例如音素片段S1和音素片段S2)的语音段。所述设备包括:语音段调整部分(例如语音段调整部分26),其根据第一语音段(例如语音段V1)和第二语音段(例如语音段V2)来形成目标片段(例如目标片段WA)以便将第一语音段和第二语音段相互连接,使得所述目标片段由与辅音音素对应的第一语音段的后部音素片段和与所述辅音音素对应的第二语音段的前部音素片段形成,并且所述语音段调整部分执行用于将所述目标片段扩展到目标时间长度以形成调整片段(例如调整片段WB)的扩展处理,使得以比所述目标片段的前部分和后部分的扩展率高的扩展率来扩展所述目标片段的中间部分,从而产生具有所述目标时间长度并且与所述辅音音素对应的调整片段的合成语音段数据(例如合成语音段数据DB);以及语音合成部分(例如语音合成部分28),其根据由所述语音段调整部分产生的合成语音段数据来产生语音信号。
在上述构造中,在对应于辅音音素的目标片段中改变扩展率,因此,与其中扩展和压缩率在语音段范围内保持固定的日本专利申请公开No.H7-129193的构造相比,可以合成出听起来自然的语音。
在本发明的一个优选方面,每个语音段数据包括与排列在时间轴上的多个帧对应的多个单位数据。在所述目标片段对应于浊辅音音素的情况下,所述语音段调整部分将所述目标片段扩展成所述调整片段,使得所述调整片段包含与所述目标片段的前部分(例如前部分σ1)对应的单位数据的时间序列、通过对与所述目标片段的中心点(例如时间点tAc)对应的单位数据进行重复而得到的多个重复单位数据的时间序列、以及与所述目标片段的后部分(例如后部分σ2)对应的多个单位数据的时间序列。
在上述方面中,将与目标片段的前部分对应的多个单位数据的时间序列和与目标片段的后部分对应的多个单位数据的时间序列用作调整片段的每个帧的单位数据,因此与例如对前部分和后部分两者进行扩展的构造相比,简化了扩展处理。根据上述方面的目标片段的扩展在目标片段对应于浊辅音音素的情况下尤为优选。
在本发明的一个优选方面中,浊辅音音素的帧的单位数据包括对语音的频谱的包络线中的形状的特性进行指示的包络数据和对该语音的频谱进行表示的频谱数据。语音段调整部分产生与所述目标片段的中心点对应的单位数据,使得产生的单位数据包括通过对所述目标片段的中心点前后的单位数据的包络数据进行内插而得到的包络数据以及恰在该中心点前后的单位数据的频谱数据。
在上述方面中,在扩展后的单位数据中包括了通过对目标片段的中心点前后的单位数据的包络数据进行内插而得到的包络数据,因此可以合成其中对目标片段中心点的语音成分进行了适当扩展的自然语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于雅马哈株式会社,未经雅马哈株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210179123.7/2.html,转载请声明来源钻瓜专利网。