[发明专利]语音合成装置和方法有效
申请号: | 201580056851.0 | 申请日: | 2015-10-20 |
公开(公告)号: | CN107077840B | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 嘉山启;松原弘明 | 申请(专利权)人: | 雅马哈株式会社 |
主分类号: | G10L13/10 | 分类号: | G10L13/10;G10L25/90 |
代理公司: | 北京天昊联合知识产权代理有限公司 11112 | 代理人: | 李铭;崔利梅 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 合成 装置 方法 | ||
本发明是用于针对由说话者(用户)说出的语音自动地生成口语回应的技术的改进,并且其特征在于:根据说话者的语音的音高控制口语回应的音高。接收说话者说出的话语(例如,问题)的语音信号(102),并且检测话语的代表性部分的音高(例如,最高音高)(106)。适当地获取对话语的回应的语音数据(110、124),并且获取基于所获取的口语回应语音数据的音高(例如,平均音高)。确定用于将获取的音高偏移至与代表性部分的音高具有特定关系的目标音高的音高偏移量(114)。当基于回应语音数据来合成口语回应时,根据音高偏移量将合成的口语回应的音高进行偏移。
技术领域
本发明涉及一种语音合成装置和方法以及一种用于执行语音合成方法的程序。
背景技术
近年来,提出了以下话音或语音合成技术。这些提出的话音或语音合成技术包括如下两种技术:其中,一种技术合成和输出与用户的说话的音调和语音质量相对应的语音,从而产生更接近真实人声的语音(例如,见专利文献1),另一种技术分析用户的语音以评价用户的心理状况和健康状况等(例如,见专利文献2)。近年来还提出了一种语音交互系统,其通过在合成的语音中输出由情景指定的内容的同时识别由用户输入的语音来实现与用户的语音交互(例如,见专利文献3)。
现有技术文献:
专利文献:
专利文献1:日本专利申请公开出版物No.2003-271194
专利文献2:日本专利No.4495907
专利文献3:日本专利No.4832097
现在,我们假设这样一种交互系统,其将前述语音合成技术和语音交互系统进行组合,并且针对通过用户的语音而给出的问题以通过话音或语音合成而合成的语音的形式来输出应答。然而,这种假设的交互系统有时会给用户这样一种感觉,就好像机器在说出回应一样。
发明内容
鉴于以上内容,因此本发明的一个目的为提供一种语音合成装置和一种语音合成方法,其能够响应于问题自动地合成语音,在不会给用户带来不自然的感觉的同时防止语音的听觉质量变差,此外,本发明还公开了一种用于存储用以实现这种语音合成方法的程序的存储介质。
在研发通过话音或语音合成来输出针对用户提出的问题的回应的人机系统的过程中,首先要考虑的是在人员之间进行了何种对话,重点关注除语言信息之外的信息,尤其是使对话具有特征的声音音高(频率)。作为人员之间的示例对话,考虑这样一种情况,其中一个人员(“人员b”)针对另一人员(“人员a”)给出的话语(例如,问题)而做出回应。在这种情况下,当“人员a”说出问题时,“人员a”和“人员b”通常对于问题的特定部分的音高具有强烈印象。当“人员b”带有赞同、赞成、肯定等的倾向来回应问题时,“人员b”以回应中的具有特征的部分的音高与上述带来印象(给人员带来强烈印象)的音高具有特定关系(更具体地说,协和音程关系)的方式说出回应的语音(回应语音)。因为“人员a”的问题的印象深的音高与“人员b”的回应中的具有特征的部分的音高具有上述关系,所以听到回应的“人员a”可能对“人员b”的回应具有良好的、舒服的和安心的印象。也就是说,在人员之间的实际对话中,可以认为问题的音高与对问题的回应的音高具有上述特定关系而不是彼此无关。因此,根据前述考虑,为了实现上述目的,本发明的发明人研发了一种语音合成装置形式的交互系统,该语音合成装置按照以下方式构造为通过话音或语音合成输出对用户提出的问题的回应。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于雅马哈株式会社,未经雅马哈株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580056851.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:利用冷却水力旋转电极的装置
- 下一篇:一种秋千式加速器束流挡板装置