[发明专利]合成字典制作装置及合成字典制作方法有效
申请号: | 201210058572.6 | 申请日: | 2012-03-07 |
公开(公告)号: | CN103021402A | 公开(公告)日: | 2013-04-03 |
发明(设计)人: | 橘健太郎;森田真弘;笼岛岳彦 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G10L13/02 | 分类号: | G10L13/02 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 刘瑞东;陈海红 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 合成 字典 制作 装置 制作方法 | ||
1.一种合成字典制作装置,其特征在于,具备:
句子存储单元,其存储预定的N个(N是自然数,N≥2)句子;
提示单元,其向用户提示从上述句子存储单元存储的上述N个句子依次选择的第1句子;
录制单元,其将朗读上述第1句子的用户的声音录制,将该录制波形与上述第1句子相关联存储;
要否判断单元,其在上述录制单元中存储M个(M是自然数,1≤M<N)上述第1句子的录制波形的状态下,根据来自用户的声音合成字典的制作指示、上述M和上述录制单元存储的全部上述录制波形的数据量中的至少一个,判断要否制作声音合成字典;
字典制作单元,其在上述要否判断单元判断需要声音合成字典的制作的场合,使用上述录制单元存储的上述录制波形及与其相关联的上述第1句子,制作声音合成字典;和
声音合成单元,其使用由上述字典制作单元制作的声音合成字典,将第2句子变换为合成波形。
2.如权利要求1所述的合成字典制作装置,其特征在于,还具备:
音质评价单元,其评价上述合成波形的音质。
3.如权利要求2所述的合成字典制作装置,其特征在于,
在上述音质评价单元中评价上述合成波形的音质没有问题的场合,上述提示单元停止向用户提示上述第1句子。
4.如权利要求2或3所述的合成字典制作装置,其特征在于,
在上述音质评价单元中评价上述合成波形的音质没有问题的场合,上述录制单元停止上述用户的声音的录制。
5.如权利要求2所述的合成字典制作装置,其特征在于,
上述声音合成单元中的上述第2句子是上述句子存储单元存储的上述N个句子的某个句子,
上述音质评价单元,根据上述录制单元存储的与上述第2句子对应的上述录制波形和上述合成波形的相似度,评价上述合成波形的音质。
6.如权利要求2所述的合成字典制作装置,其特征在于,
上述音质评价单元取得来自试听上述合成波形的用户的上述合成波形的评价。
7.如权利要求1所述的合成字典制作装置,其特征在于,
上述字典制作单元根据上述M或者上述数据量,切换声音合成字典的制作方法。
8.如权利要求7所述的合成字典制作装置,其特征在于,
上述字典制作单元在上述M或者上述数据量低于预定的阈值的场合,用适应方式制作声音合成字典。
9.如权利要求1所述的合成字典制作装置,其特征在于,
上述录制单元判断上述用户的声音的录制状态,将判断为适当录制的录制波形与上述第1句子相关联存储。
10.一种合成字典制作方法,其特征在于,具备:
提示步骤,向用户提示从句子存储单元存储的N个(N是自然数,N≥2)句子依次选择的第1句子;
录制步骤,将朗读上述第1句子的用户的声音录制,将该录制波形与上述第1句子相关联存储;
要否判断步骤,在上述录制单元中存储M个(M是自然数,1≤M<N)上述第1句子的录制波形的状态下,根据来自用户的声音合成字典的制作指示、上述M和上述录制步骤中存储的全部上述录制波形的数据量中的至少一个,判断要否制作声音合成字典;
字典制作步骤,在上述要否判断步骤判断需要声音合成字典的制作的场合,使用上述录制步骤中存储的上述录制波形及与其相关联的上述第1句子,制作声音合成字典;和
声音合成步骤,使用由上述字典制作步骤制作的声音合成字典,将第2句子变换为合成波形。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210058572.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种翻盖式下水器
- 下一篇:水电站厂房墙体与板梁分期浇筑的连接方法及结构