[发明专利]声音合成设备、声音处理设备和声音合成方法有效
申请号: | 201210320511.2 | 申请日: | 2012-08-31 |
公开(公告)号: | CN103295569A | 公开(公告)日: | 2013-09-11 |
发明(设计)人: | 嘉山启 | 申请(专利权)人: | 雅马哈株式会社 |
主分类号: | G10K15/12 | 分类号: | G10K15/12 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 陈源;李铭 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声音 合成 设备 处理 方法 | ||
技术领域
本发明涉及使用声音片段合成声音(语音或歌声)的技术。
背景技术
已经提出了片段连接型声音合成,其中通过连接多个预先提取的声音波形来生成指定为声音合成目标的声音(下文中称作“要合成的声音”)。例如,根据JP-A-2007-240564的技术,针对每个声音片段将预先提取的声音波形(片段数据)存储在存储装置中,从存储装置中连续选择与要合成的声音的语音文字(如歌词)相对应的声音波形并将其连接在一起来生成要合成的声音的声音信号。
根据JP-A-2007-240564的技术,当把超过存储装置中存储的声音波形的时间长度指定为要合成的声音的持续时间时,重复(循环)该声音波形以生成声音信号。因此,会造成以该声音波形的时间长度为周期出现规律的特征变化(例如幅度或周期的改变)的问题,而这会使得听者感受到的声音质量下降。尽管通过对每个声音波形确保足够的时间长度以使其不必重复该声音波形可以解决上述问题,但长时间存储该声音波形需要巨大的存储容量。
发明内容
有鉴于这些情况,本发明的一个目的是在降低声音合成所需的存储容量的同时避免由于声音波形的重复所导致的声音质量下降。此外,本发明的另一个目的是实现一种能够避免声音质量劣化从而降低声音合成所需的声音波形的数据量的声音合成处理,所述声音质量的劣化是由用于生成声音信号的声音波形的重复而导致的。
下面描述本发明为了解决上述问题而采用的手段。
(1)提供了一种声音合成设备,包括:
波形存储部分,其配置为对从表示有声音的声音波形在时间轴上的不同位置处提取的多个单元波形进行存储;和
波形生成部分,其配置为通过在时间轴上排列所述多个单元波形来生成合成波形。
(2)例如,波形生成部分配置为针对多个处理周期的每一个生成合成波形,所述合成波形是第一波形序列和第二波形序列之和,其中在所述第一波形序列中将从多个单元波形中选择的多个第一单元波形排列为使其强度在处理周期中随时间而增加,在所述第二波形序列中将从多个单元波形中选择的且与第一单元波形不同的多个第二单元波形排列为使其强度在处理周期中随时间而降低。
(3)例如,所述多个单元波形中的每一个都对应于声音波形的一个周期。
(4)例如,多个单元波形具有共同的峰-峰值。
(5)例如,多个单元波形具有共同的时间长度。
(6)例如,多个单元波形具有调节为使得这些单元波形之间的互相关函数最高的相位。
(7)例如,多个处理周期中的一个处理周期中的第一单元波形与该多个处理周期中紧靠所述一个处理周期之后的一个处理周期中的第二单元波形是共同的单元波形。
(8)例如,波形生成部分配置为针对每个处理周期从所述多个单元波形中随机选择第一单元波形。
(9)例如,波形生成部分配置为将所述多个处理周期的时间长度设置为使得所述多个处理周期中的一个处理周期的时间长度和所述多个处理周期中的另一个处理周期的时间长度彼此不同。
(10)例如,波形生成部分配置为随机设置所述多个处理周期中每一个的时间长度。
(11)还提供了用于生成用在声音合成设备中的多个单元波形的声音处理设备,所述声音处理设备包括:
波形提取部分,其配置为从表示有声音的声音波形在时间轴上的不同位置处提取多个单元波形;和
波形校正部分,其配置为对通过波形提取部分提取的多个单元波形进行校正,从而使得各单元波形的声学特征彼此接近。
(12)例如,波形校正部分包括周期校正部分,所述周期校正部分配置为将所述多个单元波形的时间长度校正为共同的预定长度。
(13)例如,周期校正部分包括:指标计算部分,其配置为针对彼此不同的多个备选长度中的每一个来计算失真指标值,所述失真指标值表示当所述多个单元波形中的每一个扩展或压缩至时间轴上的备选长度时所述多个单元波形中的每一个的失真度;和校正处理部分,其配置为从所述多个备选长度中选择具有表示最小失真度的失真指标值的备选长度来作为共同预定长度,并且将所述多个单元波形的时间长度调节为所述共同预定长度。
(14)例如,声音处理部分还包括失真校正部分,其配置为针对波形提取部分所提取的多个单元波形的时间长度,对所述多个单元波形的幅度进行校正,以使其幅度根据共同预定长度的长度而增加。
(15)提供了一种声音合成方法,包括:
对从表示有声音的声音波形在时间轴上的不同位置处提取的多个单元波形进行存储;和
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于雅马哈株式会社,未经雅马哈株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210320511.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:热室
- 下一篇:保险柜系统、保险柜装置及其控制方法