[发明专利]语音合成方法、装置、设备以及存储介质有效
申请号: | 201811567415.1 | 申请日: | 2018-12-20 |
公开(公告)号: | CN109523986B | 公开(公告)日: | 2022-03-08 |
发明(设计)人: | 杨杰 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L13/033 | 分类号: | G10L13/033;G10L13/08;G10L13/10 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 胡艾青;刘芳 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 合成 方法 装置 设备 以及 存储 介质 | ||
本发明提供一种语音合成方法、装置、设备以及存储介质,通过获取文本信息,并确定所述文本信息中的角色和每一个所述角色的文本内容;对每一个所述角色的文本内容进行角色识别,确定每一个所述角色的角色属性信息;根据每一个所述角色的角色属性信息,获取与各所述角色一一对应的发音人,其中,所述发音人为预存储的具有所述角色属性信息的发音对象;根据所述文本信息和所述文本信息的所述角色对应的发音人,生成多角色合成语音,提高了合成语音中不同角色的发音多样性,提高了听众对合成的语音中不同角色的区分度,提高了用户体验。
技术领域
本发明实施例涉及无人车技术领域,尤其涉及一种语音合成方法、装置、设备以及存储介质。
背景技术
随着语音技术的发展,语音技术开始应用到人们生活和工作的各个方面。例如,在有声阅读、人机对话、智能音箱、智能客服等场景中,设备可以发出合成的语音,进而为用户服务。
在现有技术中,可以获取待处理的文字,然后采用语音合成技术对文字进行处理,得到语音。
然而现有技术中,只能通过语音合成技术得到单一的发音人,但是对于多角色的场景,无法得到多角色的合成语音。例如,进行有声阅读的时候,需要得到多个角色的对话语音,但是现有技术中只能通过对文字进行语音合成,得到单一发音人发出的语音。
发明内容
本发明实施例提供一种语音合成方法、装置、设备以及存储介质,实现对不同角色的文本内容匹配相适应的语音,以语音特征对不同角色进行了区分,提高了由文本转换为语音的表现力,提高了用户体验。
本发明第一方面提供一种语音合成方法,包括:
获取文本信息,并确定所述文本信息中的角色和每一个所述角色的文本内容;
对每一个所述角色的文本内容进行角色识别,确定每一个所述角色的角色属性信息;
根据每一个所述角色的角色属性信息,获取与各所述角色一一对应的发音人,其中,所述发音人为预存储的具有所述角色属性信息的发音对象;
根据所述文本信息和所述文本信息的所述角色对应的发音人,生成多角色合成语音。
可选地,所述角色属性信息包括基础属性,所述基础属性包括性别属性和/或年龄段属性;
在所述根据每一个所述角色的角色属性信息,获取与各所述角色一一对应的发音人之前,还包括:
根据预存储的发音人的声音参数信息,对每一个预存储的发音人确定其对应的基础属性;
相应地,所述根据每一个所述角色的角色属性信息,获取与各所述角色一一对应的发音人,包括:
对每一个所述角色,获取具有所述角色对应的所述基础属性的发音人。
可选地,所述角色属性信息还包括附加属性,所述附加属性包括以下至少一种:
地域信息、音色信息、发音风格信息;
在所述根据每一个所述角色的角色属性信息,获取与各所述角色一一对应的发音人之前,还包括:
根据预存储的发音人的声音参数信息,对每一个预存储的发音人确定其对应的附加属性以及附加属性优先级;
相应地,所述根据每一个所述角色的角色属性信息,获取与各所述角色一一对应的发音人,还包括:
在具有所述角色对应的所述基础属性的发音人中,根据附加属性确定与所述角色一一对应的发音人。
可选地,所述在具有所述角色对应的所述基础属性的发音人中,根据附加属性确定与所述角色一一对应的发音人包括:
在所述角色的文本内容中,获取角色声音描述类关键词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811567415.1/2.html,转载请声明来源钻瓜专利网。