[发明专利]韵律预测方法、装置、可读介质及电子设备在审
申请号: | 202210283933.0 | 申请日: | 2022-03-21 |
公开(公告)号: | CN114613351A | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 邹雨巷;马泽君 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/10;G06F40/205;G06F40/253;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 曹寒梅 |
地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 韵律 预测 方法 装置 可读 介质 电子设备 | ||
本公开涉及一种韵律预测方法、装置、可读介质及电子设备,能够得到更加合适的韵律特征。所述方法包括:获取待处理的目标文本;根据所述目标文本和预训练的韵律预测模型,确定所述目标文本的韵律特征信息,所述韵律特征信息包括对应于多种预设韵律维度的韵律特征;其中,所述韵律预测模型包括特征提取网络和多个特征预测网络,所述特征提取网络用于提取所述目标文本的语言学信息,所述多个特征预测网络分别与所述特征提取网络连接,并且,所述多个特征预测网络各自对应一个所述预设韵律维度,每一所述特征预测网络用于根据所述特征提取网络提取出的语言学信息预测出对应于一种预设韵律维度的韵律特征。
技术领域
本公开涉及语音合成技术领域,具体地,涉及一种韵律预测方法、装置、可读介质及电子设备。
背景技术
在语言学中,韵律指的是讲话的过程中非独立音段(元音和辅音)的成分,即音节或更大单位的性质。这些性质形成语调、声调、重读和节奏等语言功能。韵律可以反映出说话者或话语的多种特征:说话者的感情状态、话语的形式(陈述、疑问还是命令)、是否存在强调、对比、焦点,以及其他无法由语法和词汇表达来表征的语言元素,相同韵律事件的表现形式不同可传达丰富的语义及其情感变化。在语音合成等任务中,在模型中加入不同的韵律特征有利于生成的音频更加自然,更具有抑扬顿挫的听感,更符合说话者所表达的语意。因此,针对文本的韵律预测(或建模),对于语音合成具有重要意义,韵律预测准确性的提升对语音合成自然度的提升有着重要作用。
发明内容
提供该部分内容以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该部分内容并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
第一方面,本公开提供一种韵律预测方法,所述方法包括:
获取待处理的目标文本;
根据所述目标文本和预训练的韵律预测模型,确定所述目标文本的韵律特征信息,所述韵律特征信息包括对应于多种预设韵律维度的韵律特征;
其中,所述韵律预测模型包括特征提取网络和多个特征预测网络,所述特征提取网络用于提取所述目标文本的语言学信息,所述多个特征预测网络分别与所述特征提取网络连接,并且,所述多个特征预测网络各自对应一个所述预设韵律维度,每一所述特征预测网络用于根据所述特征提取网络提取出的语言学信息预测出对应于一种预设韵律维度的韵律特征。
第二方面,本公开提供一种韵律预测装置,所述装置包括:
第一获取模块,用于获取待处理的目标文本;
第一确定模块,用于根据所述目标文本和预训练的韵律预测模型,确定所述目标文本的韵律特征信息,所述韵律特征信息包括对应于多种预设韵律维度的韵律特征;
其中,所述韵律预测模型包括特征提取网络和多个特征预测网络,所述特征提取网络用于提取所述目标文本的语言学信息,所述多个特征预测网络分别与所述特征提取网络连接,并且,所述多个特征预测网络各自对应一个所述预设韵律维度,每一所述特征预测网络用于根据所述特征提取网络提取出的语言学信息预测出对应于一种预设韵律维度的韵律特征。
第三方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现本公开第一方面所述方法的步骤。
第四方面,本公开提供一种电子设备,包括:
存储装置,其上存储有至少一个计算机程序;
至少一个处理装置,用于执行所述存储装置中的所述至少一个计算机程序,以实现本公开第一方面所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210283933.0/2.html,转载请声明来源钻瓜专利网。