[发明专利]语音合成方法、装置、设备以及存储介质有效

申请号：	201811567415.1	申请日：	2018-12-20
公开（公告）号：	CN109523986B	公开（公告）日：	2022-03-08
发明（设计）人：	杨杰	申请（专利权）人：	百度在线网络技术（北京）有限公司
主分类号：	G10L13/033	分类号：	G10L13/033;G10L13/08;G10L13/10
代理公司：	北京同立钧成知识产权代理有限公司 11205	代理人：	胡艾青;刘芳
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音合成方法装置设备以及存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种语音合成方法、装置、设备以及存储介质，通过获取文本信息，并确定所述文本信息中的角色和每一个所述角色的文本内容；对每一个所述角色的文本内容进行角色识别，确定每一个所述角色的角色属性信息；根据每一个所述角色的角色属性信息，获取与各所述角色一一对应的发音人，其中，所述发音人为预存储的具有所述角色属性信息的发音对象；根据所述文本信息和所述文本信息的所述角色对应的发音人，生成多角色合成语音，提高了合成语音中不同角色的发音多样性，提高了听众对合成的语音中不同角色的区分度，提高了用户体验。

技术领域

本发明实施例涉及无人车技术领域，尤其涉及一种语音合成方法、装置、设备以及存储介质。

背景技术

随着语音技术的发展，语音技术开始应用到人们生活和工作的各个方面。例如，在有声阅读、人机对话、智能音箱、智能客服等场景中，设备可以发出合成的语音，进而为用户服务。

在现有技术中，可以获取待处理的文字，然后采用语音合成技术对文字进行处理，得到语音。

然而现有技术中，只能通过语音合成技术得到单一的发音人，但是对于多角色的场景，无法得到多角色的合成语音。例如，进行有声阅读的时候，需要得到多个角色的对话语音，但是现有技术中只能通过对文字进行语音合成，得到单一发音人发出的语音。

发明内容

本发明实施例提供一种语音合成方法、装置、设备以及存储介质，实现对不同角色的文本内容匹配相适应的语音，以语音特征对不同角色进行了区分，提高了由文本转换为语音的表现力，提高了用户体验。

本发明第一方面提供一种语音合成方法，包括：

获取文本信息，并确定所述文本信息中的角色和每一个所述角色的文本内容；

对每一个所述角色的文本内容进行角色识别，确定每一个所述角色的角色属性信息；

根据每一个所述角色的角色属性信息，获取与各所述角色一一对应的发音人，其中，所述发音人为预存储的具有所述角色属性信息的发音对象；