[发明专利]韵律预测方法、装置、设备以及存储介质在审
| 申请号: | 202011321328.5 | 申请日: | 2020-11-23 |
| 公开(公告)号: | CN112289305A | 公开(公告)日: | 2021-01-29 |
| 发明(设计)人: | 刘世超 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
| 主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L13/10;G10L25/27 |
| 代理公司: | 北京海智友知识产权代理事务所(普通合伙) 11455 | 代理人: | 吴京顺 |
| 地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 韵律 预测 方法 装置 设备 以及 存储 介质 | ||
1.一种韵律预测方法,包括:
获取目标文本;
确定所述目标文本的语言特征向量;
根据所述目标文本、所述语言特征向量,确定所述目标文本中的韵律边界标识;
基于所述韵律边界标识,确定所述目标文本的韵律,并输出。
2.根据权利要求1所述的方法,其中,所述确定所述目标文本的语言特征向量,包括:
根据所述目标文本和预训练的分类模型,确定所述目标文本对应的语言标识,其中所述预训练的分类模型用于表征文本与语言标识的对应关系;
根据所述目标文本、所述语言标识和预训练的转换模型,确定所述目标文本对应的语言特征向量,其中,所述预训练的转换模型用于表征基于所述语言标识的文本与语言特征向量的对应关系。
3.根据权利要求1所述的方法,其中,所述确定所述目标文本中的韵律边界标识,包括:
根据所述目标文本、所述语言特征向量以及预训练的韵律预测模型,确定所述目标文本中的韵律边界标识,其中,所述预训练的韵律预测模型用于表征基于所述语言特征向量的文本与韵律边界标识的对应关系。
4.根据权利要求1所述的方法,其中,根据所述目标文本、所述语言特征向量,确定所述目标文本中的韵律边界标识,包括:
根据所述目标文本和所述语言特征向量,确定文本分布及上下文信息;
基于所述文本分布及上下文信息和预训练的韵律预测模型,确定所述目标文本中的韵律边界标识,其中,所述韵律预测模型用于表征文本分布及上下文信息与韵律边界标识的对应关系。
5.一种用于训练韵律预测模型的方法,包括:
获取初始模型,其中,所述初始模型包括初始韵律预测模型;
获取训练样本集合,其中,所述训练样本集合包括不同语言的文本、标注的各文本对应的语言特征向量以及标注的各文本对应的韵律边界标识;
将所述不同语言的文本以及标注的各文本对应的语言特征向量作为所述初始模型的输入,将与输入的所述不同语言的文本以及标注的各文本对应的语言特征向量对应的韵律边界标识作为期望输出,将训练得到的初始模型的初始韵律预测模型确定为所述韵律预测模型。
6.根据权利要求5所述的方法,其中,所述获取训练样本集合,包括:
获取不同语言的文本以及不同语言的文本的语言特征;
根据各所述语言特征和预设的特征与向量的对应关系,确定各所述语言特征对应的语言特征向量;
获取各所述语言特征向量所对应的文本对应的韵律边界标识;
将所述不同语言的文本、对应所述不同语言的文本的各所述语言特征向量以及各所述韵律边界标识组合成训练样本。
7.一种韵律预测装置,包括:
获取单元,被配置成获取目标文本;
语言特征向量确定单元,被配置成确定所述目标文本的语言特征向量;
韵律边界标识确定单元,被配置成根据所述目标文本、所述语言特征向量,确定所述目标文本中的韵律边界标识;
输出单元,被配置成基于所述韵律边界标识,确定所述目标文本的韵律,并输出。
8.一种用于训练韵律预测模型的装置,包括:
模型获取单元,被配置成获取初始模型,其中,所述初始模型包括初始韵律预测模型;
样本获取单元,被配置成获取训练样本集合,其中,所述训练样本集合包括不同语言的文本、标注的各文本对应的语言特征向量以及标注的各文本对应的韵律边界标识;
训练单元,被配置成将所述不同语言的文本以及标注的各文本对应的语言特征向量作为所述初始模型的输入,将与输入的所述不同语言的文本以及标注的各文本对应的语言特征向量对应的韵律边界标识作为期望输出,将训练得到的初始模型的初始韵律预测模型确定为所述韵律预测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011321328.5/1.html,转载请声明来源钻瓜专利网。





